Part of speech tagging viết tắt POS tagging/PoS tagging/POST

Part of speech tagging viết tắt POS tagging/PoS tagging/POST còn được gọi là ngữ hoá tagging hoặc phân loại từ-phân loại, là quá trình đánh dấu một từ trong một văn bản (corpus) tương ứng với một phần cụ thể của lời nói, dựa trên cả định nghĩa và ngữ cảnh – tức là mối liên hệ với các từ liền kề và liên quan trong một cụm từ, câu hoặc đoạn. Một hình thức đơn giản hóa điều này thường được dạy cho trẻ em trong độ tuổi đi học, trong việc nhận biết các từ như là danh từ, động từ, tính từ, trạng từ, vv

Sau khi thực hiện bằng tay, POS tagging bây giờ đã được thực hiện trong ngữ cảnh của ngôn ngữ học tính toán, sử dụng các thuật toán kết hợp các thuật ngữ rời rạc, cũng như các phần ẩn của lời nói, phù hợp với một bộ các thẻ mô tả. Các thuật toán gắn thẻ POS chia thành hai nhóm đặc biệt: dựa trên quy tắc và ngẫu nhiên. Thẻ tag của E. Brill, một trong những thẻ tag tiếng Anh đầu tiên và được sử dụng rộng rãi nhất, sử dụng các thuật toán dựa trên quy tắc.