Một chút đặc hiệu hơn về vấn đề chính xác của bạn sẽ được tốt. Có rất nhiều kỹ thuật khác nhau mà bạn có thể sử dụng. Nhiều người trong số này được thúc đẩy bởi các phần dữ liệu khác. Tất nhiên bạn có thể sử dụng Lucene và xây dựng các chỉ mục của riêng bạn. Có những ràng buộc cho nhiều ngôn ngữ để làm sáng tỏ. Di chuyển lên đó cũng là dự án Solr là Lucene với rất nhiều công cụ và chức năng bổ sung xung quanh nó. Điều đó có thể phù hợp hơn với những gì bạn đang tìm kiếm.
Ý định là công cụ tìm kiếm phức tạp và hiện đại nhất dựa trên ý định thống kê để hỗ trợ sắp xếp kết quả. Bạn luôn có thể có một nút bài viết hữu ích này và lưu trữ văn bản truy vấn dẫn đến các tài liệu hữu ích. Sau đó, bạn có thể thêm một lớp thông tin vào chỉ mục để tăng các từ hoặc cụm từ cụ thể và giúp chúng trỏ đến các tài liệu nhất định.
Một số điều cần suy nghĩ về ... Có bao nhiêu tài liệu? Độ dài trung bình là bao nhiêu? Chúng có được cập nhật thường xuyên không? Người dùng làm gì với tài liệu? Sự lây lan của các từ duy nhất vào tài liệu trông như thế nào? (Đơn giản hơn là bạn có thể dễ dàng kết hợp truy vấn với một (các) tài liệu cụ thể dựa trên các tính năng độc đáo phổ biến.)
Nếu trên web, bạn luôn có thể tạo công cụ tìm kiếm tùy chỉnh google chỉ tìm kiếm trang web của bạn có thể thấy điều này là không tối ưu vì nhiều lý do.
Bạn luôn có thể bắt đầu với một chỉ mục đơn giản và dần dần làm cho nó tinh vi hơn bằng cách nói chuyện với người dùng và thu thập dữ liệu.
Nguồn
2008-12-19 22:11:41