Cụm từ thông dụng của trình phân tích cú pháp của NLTK có thể khớp với thẻ POS, nhưng chúng cũng có thể khớp với các từ cụ thể không?
Vì vậy, giả sử tôi muốn cắt bất kỳ cấu trúc nào với một danh từ theo sau là động từ "trái" (gọi mẫu này là L). Ví dụ, câu "the \ DT dog \ NN left \ VB" nên được chunked là
(S (DT) (L (NN dog) (VB left))), nhưng câu "the \ DT dog \ NN ngủ \ VB "sẽ không được chunked cả.Các từ phù hợp với trình phân tích cú pháp của NLTK
Tôi chưa thể tìm thấy bất kỳ tài liệu nào về cú pháp chunking regex và tất cả các ví dụ tôi đã thấy chỉ khớp với thẻ POS.
bạn có thể cung cấp một ví dụ dọc theo dòng: chunkGram = r "" "Chunk: {? * * + }" "" –
ProfVersaggi