2012-10-10 19 views
6

Tôi nghĩ mergeFactor có thể được coi là số tối đa của phân đoạn, nhưng khi nó được đặt thành 10, tôi nhận được 16 phân đoạn sau chỉ mục và hợp nhất xảy ra khi số lượng trong phân đoạn vượt quá 15 và 20. Tôi thực sự bối rối về giá trị trung bình của mergeFactor.mergeFactor sử dụng trong solr 4.0

Dưới đây là cấu hình của tôi

<ramBufferSizeMB>32</ramBufferSizeMB> 
<maxBufferedDocs>100000</maxBufferedDocs> 
<mergeFactor>10</mergeFactor> 

Trả lời

10

Từ Solr Wiki - SolrPerformanceFactors - Merge Factor documentation

Các mergeFactor khoảng xác định số lượng các phân đoạn. Giá trị mergeFactor cho Lucene biết có bao nhiêu phân đoạn có kích thước bằng nhau để xây dựng trước khi hợp nhất chúng thành một đoạn. Nó có thể được coi là cơ sở của một hệ thống số.

Đây không phải là con số chính xác mà là hướng dẫn về cách chỉ mục được quản lý trên đĩa. Dưới đây là một số hướng dẫn tốt thêm về cách gì cài đặt khác nhau của giá trị này có nghĩa là đến việc thực hiện chỉ số của bạn:

mergeFactor Cân bằng

giá trị cao yếu tố kết hợp (ví dụ, 25):

  • Pro: Thông thường cải thiện tốc độ lập chỉ mục
  • Con: Kết hợp ít thường xuyên hơn, dẫn đến tập hợp có nhiều tệp chỉ mục hơn có thể làm chậm tìm kiếm

có giá trị thấp yếu tố kết hợp (ví dụ, 2):

  • Pro: số nhỏ các tập tin chỉ mục, trong đó tăng tốc độ tìm kiếm.
  • Con: Thêm phân đoạn hợp nhất làm chậm lập chỉ mục.

Bạn cũng có thể tham khảo các mergeFactor documentation on the Lucidworks site cho một số chi tiết về cách thức mergeFcator hoạt động và có thể ảnh hưởng đến tốc chỉ số của bạn. Nhưng tôi nghĩ rằng chìa khóa ở đây là đoạn này:

Nếu tạo ra một phân khúc mới sẽ gây ra số lượng thấp nhất cấp phân đoạn để vượt quá giá trị mergeFactor, sau đó tất cả những phân đoạn được sáp nhập với nhau để tạo thành một lượng lớn đơn phân đoạn. Vì vậy, nếu hợp nhất yếu tố là mười, mỗi kết quả hợp nhất trong việc tạo ra một phân đoạn duy nhất đó là khoảng mười lần lớn hơn mỗi mười thành phần của nó. Khi có cài đặt mergeFactor cho các phân đoạn lớn hơn, thì chúng lần lượt được hợp nhất thành một phân đoạn đơn lớn hơn. Quá trình này có thể tiếp tục vô thời hạn.

+1

Có một blog tuyệt vời về phân đoạn hợp nhất.http: //blog.mikemccandless.com/2011/02/visualizing-lucenes-segment-merges.html – bata

Các vấn đề liên quan