Tôi có một bộ sưu tập hóa đơn và Hóa đơn, do đó không có ngữ cảnh trong văn bản (nghĩa là họ không kể một câu chuyện). Tôi muốn trích xuất tên người từ các hóa đơn đó. Tôi đã thử OpenNLP nhưng chất lượng của mô hình được đào tạo không tốt bởi vì tôi không có ngữ cảnh. vì vậy câu hỏi đầu tiên là: liệu tôi có thể đào tạo mô hình chỉ chứa tên người mà không có ngữ cảnh? và nếu có thể, bạn có thể cho tôi bài viết hay về cách tôi xây dựng mô hình mới (hầu hết các bài viết mà tôi đọc không giải thích các bước mà tôi nên tạo để xây dựng mô hình mới).Trích xuất Tên người từ văn bản không có cấu trúc
Tôi có tên cơ sở dữ liệu với hơn 100.000 người (tên, họ), vì vậy nếu hệ thống NER không hoạt động trong trường hợp của tôi (vì không có ngữ cảnh), cách tốt nhất để tìm kiếm những ứng cử viên đó (ý tôi là tìm kiếm từng tên với tất cả các họ khác?)
cảm ơn.