2011-08-05 41 views
8

Cách tối ưu hóa chỉ mục solr. Tôi muốn tối ưu hóa chỉ mục solr của tôi cho tôi cố gắng thay đổi trong solrconfig.xml nó được lập chỉ mục nhưng tôi muốn làm thế nào để xác minh rằng chúng được tối ưu hóa và có điều gì liên quan đến tối ưu hóa chỉ mục.Cách tối ưu hóa chỉ số solr

Trả lời

2

Có nhiều cách khác nhau để tối ưu hóa chỉ mục. Bạn có thể kích hoạt một trong các tập lệnh cơ bản solr: http://wiki.apache.org/solr/SolrOperationsTools#optimize

Bạn cũng có thể đặt optimize=true khi nhập đầy đủ hoặc trong khi thêm dữ liệu mới. ... hay đơn giản là kích hoạt một cam kết với optimize=true

Có lẽ điều này cũng có thể là thú vị cho các nhu cầu của bạn: http://wiki.apache.org/solr/UpdateXmlMessages#A.22commit.22_and_.22optimize.22

0

Đối với thử nghiệm bao nhiêu sự thay đổi bạn làm tối ưu hóa việc lập chỉ mục, chỉ cần viết một indexer tùy chỉnh và thêm nội dung được tạo ngẫu nhiên. Thêm một số lượng lớn tài liệu (500.000 hoặc 1.000.000) và đo thời gian cần thiết.

Làm theo các bài viết được chia sẻ ở trên mà tôi đã tự tạo cho mình một trình chỉ mục tùy chỉnh và tôi đã quản lý để tối ưu hóa thời gian cần để lập chỉ mục tài liệu lên 80%.

13

Tôi thấy đây là cách dễ nhất để tối ưu hóa chỉ mục Solr. Trong ngữ cảnh của tôi "tối ưu hóa" có nghĩa là hợp nhất tất cả các phân đoạn chỉ mục.

curl http://localhost:8983/solr/<core_name>/update -F stream.body=' <optimize />' 
+1

Nhưng điều này doesnot trả lại bất kỳ tình trạng sau khi thực hiện lệnh này. và tôi không thấy bất kỳ thay đổi nào trong trang quản trị của mình. Cmd bị mắc kẹt – Milee

7

Kiểm tra kích thước lõi tương ứng trước khi bạn bắt đầu.

Mở Terminal 1:

watch -n 10 "du -sh /path to core/data/*" 

Mở Terminal 2 và Execute:

curl http://hostname:8980/solr/<core>/update?optimize=true 

Thay vì "cốt lõi", cập nhật tên tương ứng của bạn của lõi.

Bạn có thể thấy kích thước của lõi sẽ tăng dần khoảng gấp đôi kích thước của dữ liệu được lập chỉ mục của bạn và sẽ giảm đột ngột. Điều này sẽ mất thời gian phụ thuộc vào dữ liệu solr của bạn.

Ví dụ: 50G dữ liệu được lập chỉ mục tăng gần 90G và giảm xuống dữ liệu 25G được tối ưu hóa. Và thông thường sẽ mất 30-45 phút cho lượng dữ liệu này.

Why doesn't my index directory get smaller (immediately) when i delete documents? force a merge? optimize?