Cách tốt nhất để xử lý từ đồng nghĩa (cụm từ) sử dụng Lucene là gì? Đặc biệt, khi tôi cần thực hiện các truy vấn như: a HOẶC b HOẶC c KHÔNG dTừ đồng nghĩa sử dụng Lucene
Làm cách nào để thêm trường mới được gọi là "từ đồng nghĩa" vào từng tài liệu trong khi lập chỉ mục? Giá trị của trường này sẽ có danh sách tất cả các từ đồng nghĩa. Nó sẽ được thêm vào một tài liệu chỉ khi tài liệu đó có bất kỳ từ đồng nghĩa nào.
Sau đó tôi sẽ thực hiện truy vấn tìm kiếm "OR" sẽ tìm kiếm từ khóa tìm kiếm trong trường này cùng với các trường khác.
Cách tiếp cận này có thể hoạt động tốt cho bất kỳ loại truy vấn nào không?
FYI, Từ đồng nghĩa trong ứng dụng của tôi hoàn toàn tùy chỉnh chứ không phải từ từ điển tiếng Anh ... nghĩa là. "Nhà lãnh đạo toàn cầu về tài chính" cũng có thể có nghĩa là "Ngân hàng đầu tư hàng đầu" hoặc "Công ty tài chính Fortune 500", v.v.
Vui lòng đề nghị.
Cảm ơn.
Cảm ơn các đầu vào ur Adam ... Bạn có thể vui lòng tham khảo lại câu hỏi của tôi không? –
Mô-đun WordNet xây dựng chỉ mục Lucene, giống như bạn. Chỉ mục này mà nó xây dựng cuối cùng được sử dụng để mở rộng truy vấn. Nếu bạn chỉ đơn giản là cố gắng xây dựng chỉ mục này từ từ điển của WordNet, tôi chắc chắn bạn có thể dễ dàng biết tên trường nào đang sử dụng cho chỉ mục của nó và thêm chính các mục nhập của riêng bạn. –