2012-09-04 50 views
7

Tôi có một cấu hình SolrCloud như sau: exploration of SolrCloud, sự khác biệt là tôi sử dụng Solr 4.0.0 Beta. Ngay cấu hình:Cấu hình DataImportHandler trong SolrCloud với ZooKeeper

  • Zookeeper trên cổng mặc định 2181
  • 3 trường hợp của Solr chạy trên các cổng khác nhau

này chỉ dành cho mục đích thử nghiệm. Cấu hình mong muốn là với 3 phiên bản ZooKeeper (một cho mỗi trường hợp Solr). Tôi quản lý để lập chỉ mục một số tập tin XML với lệnh curl.

Câu hỏi:

  1. Làm thế nào tôi có thể cấu hình DIH/bộ sưu tập? Tôi quản lý để thay đổi solrconfig.xml (config cho dataimport-handler), thêm vào lib trình điều khiển thích hợp cho kết nối DB, nhưng trong admin solr tôi nhận được "xin lỗi, không có dataimport-handler được định nghĩa!" Những thay đổi có thể được theo dõi trong zookeeper (tôi thấy data_config.xml) và trong bảng quản trị solr tôi có thể xem phiên bản cập nhật của solrconfig.xml.

  2. Bất kỳ hướng dẫn tốt nào cho việc triển khai sản xuất của solrcloud (với somthink như cấu hình mong muốn được đề cập trước đó) trên một hoặc nhiều máy cho Ubuntu 12.04 LTS?

Mọi lời khuyên sẽ được đánh giá cao! Cảm ơn trước!

Trả lời

4

Thông thường cấu hình DIH không liên quan gì đến thời điểm bạn đang sử dụng một cá thể Solr hoặc nhiều phiên bản trong cấu hình solrCloud. DIH sẽ ghi dữ liệu trong chỉ mục Lucene của cá thể hiện tại, và sau đó nó lên đến zooKeeper để speread nó xung quanh trên các trường hợp khác.

Hãy chắc chắn rằng DIH bạn được cấu hình propertly:

Trong solrconfig.xml, tất cả các thư viện cần thiết được nạp. Điều này có nghĩa là hai bình DIH:

<lib dir="../../../dist/" regex="solr-dataimporthandler-4.3.0.jar" /> 
<lib dir="../../../dist/" regex="solr-dataimporthandler-extras-4.3.0.jar" /> 

cũng như các lọ khác bạn có thể cần (như trình điều khiển JDBC cơ sở dữ liệu, v.v.).

Vẫn trong solrconfig.xml đảm bảo xử lý DIH được khai báo, một cái gì đó như thế này:

<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"> 
    <lst name="defaults"> 
     <str name="config">data-config.xml</str> 
    </lst> 
</requestHandler> 

Cuối cùng, tập tin cấu hình bạn đã khai báo trong xử lý DIH (data-config.xml) phải ở trong cùng một thư mục "conf" dưới dạng solrconfig.xml và phải có nội dung phù hợp, chẳng hạn như:

<dataConfig> 

<dataSource type="JdbcDataSource" name="myDataSource" driver="oracle.jdbc.driver.OracleDriver" url="jdbc:oracle:thin:@someHost:1521:someDb" user="someUser" password="somePassword" batchSize="5000"/> 

<document name="myDoc" > 
    <entity name="myDoc" dataSource="myDatasource" transformer="my.custom.Transformer" query="select col1, col2, col3 from table1 where whatever" /> 
</document> 

</dataConfig> 
+1

Có điều này cũng phù hợp với tôi. Tôi sử dụng solr trong nhiều năm nhưng độc lập luôn luôn cắt nó cho tôi. bây giờ nó không, đám mây solr là mới đối với tôi. Tôi thấy khó để làm cho cây cầu hiểu rằng cấu hình được lưu trữ trên cấu trúc tệp sở thú. –

Các vấn đề liên quan