Tôi có một ứng dụng dựa trên Java và một bộ từ khóa trong cơ sở dữ liệu MySQL (trong tổng số khoảng 3 từ khóa, mỗi từ khóa có thể bao gồm nhiều từ, ví dụ: "memory", " ngôi nhà cũ "," luật Liên minh châu Âu ", v.v.).Tìm kiếm từ khóa trong Java
Người dùng tương tác với ứng dụng bằng cách tải lên tài liệu có văn bản tùy ý (một số trang hầu hết các lần). Điều tôi muốn làm là tìm kiếm liệu và trong tài liệu có bất kỳ từ khóa nào trong số 3 triệu từ khóa xuất hiện hay không.
Tôi đã thử sử dụng vòng lặp và tìm kiếm tài liệu cho từng từ khóa nhưng điều này không hiệu quả chút nào. Tôi tự hỏi nếu có một thư viện để thực hiện tìm kiếm theo cách hiệu quả hơn.
Tôi rất cảm kích mọi trợ giúp.
Điều gì về băm cửa hàng cho mỗi từ khóa trong cột bên cạnh từ khóa và trong khi đọc tài liệu, hãy kiểm tra từng từ theo, ví dụ: 'chọn từ khóa từ khóa trong đó keyword_hash = calculateHash (wordToCheck) '? – rzysia
Những gì bạn cần phải xem xét là những gì sẽ là con đường ngắn nhất. Thực hiện 3 triệu tìm kiếm hoặc xây dựng các cụm từ N từ tài liệu được tải lên. Một giải pháp có thể là xây dựng một tìm kiếm của tất cả các từ khóa 3M để tìm kiếm tài liệu. Sử dụng Công cụ đánh dấu từ khóa của Lucenes và đối sánh tất cả các từ được đánh dấu với từ khóa 3M;) –
Có cách nào để nhận được nhiều kết quả từ khóa trong cùng một phần văn bản được trích xuất trong công cụ đánh dấu không? Hoặc thậm chí tốt hơn là có một cấu trúc có thể trả về danh sách các từ khóa phù hợp được tìm thấy trong tệp không? –