Tôi đang cố gắng trích xuất các thực thể được đặt tên từ văn bản của tôi bằng NLTK. Tôi thấy rằng NLTK NER không phải là rất chính xác cho mục đích của tôi và tôi muốn thêm một số thẻ của riêng tôi nữa. Tôi đã cố gắng tìm cách đào tạo NER của riêng mình, nhưng dường như tôi không thể tìm được nguồn tài nguyên phù hợp. Tôi có một vài câu hỏi liên quan đến NLTK-NLTK Công nhận thực thể được đặt tên với dữ liệu tùy chỉnh
- Tôi có thể sử dụng dữ liệu của riêng tôi để đào tạo một Entity Recognizer tên trong NLTK?
- Nếu tôi có thể đào tạo bằng cách sử dụng dữ liệu của riêng mình, tệp named_entity.py có bị sửa đổi không?
- Định dạng tệp đầu vào phải nằm trong IOB, ví dụ: Eric NNP B-PERSON?
- Có tài nguyên nào - ngoài sách dạy nấu ăn nltk và nlp bằng python mà tôi có thể sử dụng không?
Tôi thực sự sẽ đánh giá cao sự giúp đỡ trong vấn đề này
Duyệt qua trang SNER, tôi thấy rằng thậm chí có giao diện python [ở đây] (https://github.com/dat/pyner). Không chắc chắn nó trưởng thành như thế nào, nhưng nó có thể hữu ích. – senderle
Câu hỏi này xuất hiện rất nhiều trong một tìm kiếm để cải thiện nltk được gọi là nhận dạng đối tượng, nhưng nói 'lol sử dụng cái gì khác' không phải là thông tin. – blueblank
Tôi đã có cùng một vấn đề và chia sẻ những gì làm việc cho tôi. Xin lỗi nếu điều đó khiến bạn thất vọng: ( – jjdubs