2012-10-18 41 views
13

Tôi đang cố gắng tìm ra các chỉ số sau trong ES.Làm cách nào để lập chỉ mục và lưu trữ nhiều ngôn ngữ trong ElasticSearch

Tôi có nhiều tài liệu là trình thu thập thông tin từ trang web với ngôn ngữ khác nhau. Mỗi tài liệu có một thể loại như Sân bay, nhà hàng, sông, bãi biển vv, và đó là ngôn ngữ như tiếng Ả Rập, tiếng Anh .. như

doc {ngôn ngữ:. "Eng", nội dung: "cái gì ở đây" , thể loại: "bãi biển"}

doc {ngôn ngữ: "vn", nội dung: "Xin chào", thể loại: "bãi biển"}

tôi muốn đánh chỉ mục và tìm kiếm tài liệu với mỗi ngôn ngữ;

tôi chọn tùy chọn tiếng Anh, và tìm kiếm với truy vấn "ở đây" => resutls

Tôi có nên:

  1. cài đặt từng đàn hồi Core (mỗi máy mỗi ngôn ngữ) cho mỗi ngôn ngữ. Chỉ cần sao chép ES để chạy :)

    Ví dụ: tạo elasticsearch_ENGLISH, elastichsearch_VIETNAMESE

  2. tạo ra mỗi ngôn ngữ với mỗi chỉ số của ElasticSearch Ví dụ: tạo indexs

/tiếng Anh/loại/

/vietnames/loại/ . Khi tôi tìm kiếm một số truy vấn, tôi chỉ tìm kiếm chỉ mục ngôn ngữ

HOẶC làm theo cách khác mà tôi không biết :)?

Trả lời

8

Không chắc chắn tôi đã hiểu rõ mối lo ngại của bạn.

Nếu bạn cần tìm kiếm trên cụm đầy đủ (ý tôi là tìm kiếm bằng mọi ngôn ngữ), bạn không thể tạo một thiết lập cho mỗi ngôn ngữ.

Điều đó nói rằng, bạn có nhiều lựa chọn:

Nó không phải là một câu trả lời đầy đủ nhưng một số manh mối để giúp bạn ...

+0

Cảm ơn dadoonet, :) có một chỉ số cho mỗi ngôn ngữ là tốt nhất cho tình huống này – phuongdo

+0

lớn gợi ý, cảm ơn. Tôi vừa cập nhật các liên kết trong câu trả lời của bạn vì dường như các trang đã chuyển. – Tom

+1

có một bài đăng tốt về điều này ở đây http: //gibrown.wordpress.com/2013/05/01/ba nguyên tắc-cho-đa-indexing-in-elasticsearch / – hellvinz

Các vấn đề liên quan