Tôi đã thực hiện đo điểm chuẩn cho Thời gian lập chỉ mục cho Sphinx & Solr. Nhân sư vượt xa so với Solr liên quan đến thuật toán lập chỉ mục (thời gian lập chỉ mục siêu nhanh và kích thước chỉ mục nhỏ).
Khi bạn nói 10 trang văn bản, có vẻ như bạn thậm chí không cần lập chỉ mục Sphinx thời gian thực. Bạn có thể làm theo lược đồ lập chỉ mục + delta chính trong Sphinx (bạn có thể thấy rằng trên Tài liệu Nhân sư). Nó sẽ là siêu nhanh và gần thời gian thực. Nếu bạn muốn được trợ giúp thêm về vấn đề này, vui lòng hỏi, sẽ vui lòng giải thích cho bạn.
Solr là tuyệt vời nhưng khi nói đến thuật toán tối ưu hóa đá nhân sư !! Hãy thử Sphinx.
Đến với câu hỏi của bạn trong nhận xét, Solr/Lucene hỗ trợ lập chỉ mục gia tăng (được gọi là nhập delta trong thuật ngữ của chúng) và cấu hình yên tĩnh dễ dàng, tuy nhiên chúng khá chậm so với phương pháp được Sphinx sử dụng.
Main + Delta đủ nhanh bởi vì những gì bạn có thể làm là tạo bảng tạm thời lưu trữ văn bản mới trong đó và lập chỉ mục đó. Theo tài liệu: Sphinx hỗ trợ cập nhật chỉ mục "sống" (gần như thời gian thực) và có thể được triển khai bằng cách sử dụng được gọi là lược đồ "chính + delta".Ý tưởng là thiết lập hai nguồn và hai chỉ mục, với một chỉ mục "chính" cho dữ liệu và một "delta" cho các tài liệu mới.
Nói ví dụ bạn có 10 triệu bản ghi để bạn có thể giữ điều đó làm chỉ mục chính và tất cả tài liệu mới được thêm vào bảng mới sẽ hoạt động như đồng bằng. Bảng mới này có thể được lập chỉ mục theo thời gian (giả sử mỗi 1 giờ) và dữ liệu có thể tìm kiếm được trong vòng vài giây khi bạn có 10 trang văn bản. Bây giờ sau khi hồ sơ mới của bạn đang được tìm kiếm, bạn có thể hợp nhất các tài liệu của bảng chính + bảng delta có thể được thực hiện mà không can thiệp vào tìm kiếm của bạn. Khi các tài liệu được sáp nhập, hãy làm trống bảng mới và sau một giờ, bạn có thể thực hiện lại toàn bộ quá trình. Tôi hy vọng bạn có được điều đó, xin vui lòng hỏi bất kỳ câu hỏi nào.
Cảm ơn bạn đã giúp đỡ của bạn. Từ những gì tôi đọc chính + delta là chính xác những gì tôi cần. Nhưng có một điểm không rõ ràng trong tài liệu; họ nói nó sẽ giảm thời gian lập chỉ mục xuống còn 30 đến 60 giây. Trong trường hợp của tôi, nó là rất quan trọng để có văn bản mới sẵn sàng để được tìm kiếm trong vòng vài giây (tối đa một phút). Là đồng bằng chính đủ nhanh? Từ những gì tôi thấy Nhân sư là con đường để đi. – applechief
Bạn được chào đón nhiều nhất. Bạn có thể xem câu trả lời đã chỉnh sửa của tôi ở trên. Main + Delta sẽ làm việc tuyệt vời cho bạn vì lập chỉ mục Sphinx thực sự rất nhanh. Tuy nhiên một điều nữa: Xin vui lòng cũng có một cái nhìn tại các chỉ số thời gian thực trong Sphinx như đã đề cập trong một trong những câu trả lời ở trên, tôi chưa bao giờ sử dụng nó nhưng nó có vẻ đầy hứa hẹn. Sau khi áp dụng cả hai cho dữ liệu của bạn, bạn có thể kiểm tra những gì phù hợp nhất với bạn. – Yavar