Tôi có một tệp chỉ mục Solr/Lucene khoảng 700 Gb. Các tài liệu mà tôi cần lập chỉ mục đang được đọc trong thời gian thực, khoảng 1000 tài liệu mỗi 30 phút được gửi và cần được lập chỉ mục. Trong kịch bản của tôi, một tập lệnh chạy 30 phút một lần để lập chỉ mục các tài liệu chưa được lập chỉ mục, vì đó là yêu cầu các tài liệu mới nên tìm kiếm càng sớm càng tốt, nhưng quá trình này làm chậm quá trình tìm kiếm.Cách tốt nhất để giữ chỉ mục thời gian thực là gì?
Đây có phải là cách tốt nhất để tôi có thể lập chỉ mục các tài liệu mới nhất hoặc có một số cách khác tốt hơn!
Cập nhật: Solr hiện có (gần) khả năng tìm kiếm thời gian thực. – mt3
@ mt3 link để biết thêm thông tin? – Simon
@Simon Xin lỗi vì đã trả lời chậm. Nó nằm trong thân cây của nhánh Solr/Lucene. http://wiki.apache.org/solr/NearRealtimeSearch – mt3