Tôi đang sử dụng Stanford POS tagger để phân tích các câu hỏi. Đó là một trong những trình gắn thẻ POS tốt nhất có sẵn trong kinh nghiệm của tôi, nhưng một câu hỏi đơn giản như "Khi nào Nixon chết?" không chính xác chú thích nhưCó một trình gắn thẻ POS có thể phân tích cú pháp "Nixon chết khi nào?" đúng không?
When_WRB did_VBD Nixon_NNP die_NN
Vấn đề là "die_NN". Rõ ràng "chết" không phải là danh từ trong trường hợp này mà là một động từ. Điều này xảy ra với nhiều câu hỏi hơn. Câu hỏi của tôi là:
- Có thể tinh chỉnh trình gắn thẻ POS của Stanford để đưa ra chú thích chính xác cho câu này không? Hoặc cách khác, hãy để nó tạo ra nhiều chú thích trong đó một chú thích nào là đúng?
- Có bất kỳ trình gắn thẻ POS nào khác có giao diện Java có thể phân tích cú pháp các câu hỏi như vậy một cách chính xác không?
Vì vậy, tuyên bố từ chối trách nhiệm tiêu chuẩn là bạn sẽ không bao giờ tìm thấy trình gắn thẻ POS sẽ luôn hoạt động bình thường. Nhưng, tôi nghĩ rằng người viết thẻ POS của Stanford thực sự có được quyền này? Ít nhất trong phiên bản mới nhất của mã? Nếu bạn gõ vào "Khi nào Nixon chết" thành corenlp.run, nó chính xác "chết" như một VB. –
@Gabor, bạn nói đúng. Nếu bạn nâng cấp lên bản beta mới nhất, nó hoạt động tốt. Bạn có thể quảng cáo nhận xét của mình cho câu trả lời không? Sau đó, tôi có thể cung cấp cho bạn tiền thưởng. –