2011-11-18 37 views
5

Tôi đã quyết định sử dụng ElasticSearch làm cửa hàng chính cho dữ liệu chính của trang web tìm kiếm của mình. Nó là một cơ sở dữ liệu NoSQL cung cấp tìm kiếm văn bản đầy đủ và khả năng tìm kiếm tuyệt vời khác.Tìm kiếm đàn hồi, kho dữ liệu cho người dùng và dữ liệu xã hội?

Sẽ hữu ích khi lưu trữ dữ liệu người dùng và các mối quan hệ xã hội của tôi trong công cụ Tìm kiếm Đàn hồi không? Hoặc tôi nên lưu trữ điều này trong một cơ sở dữ liệu riêng biệt?

+0

yea, tôi đã xem câu hỏi đó, nhưng tôi tò mò muốn biết dữ liệu người dùng và xã hội cụ thể có khả thi trong cơ sở dữ liệu tìm kiếm đàn hồi hay không. – onejigtwojig

+0

Nếu không có thêm chi tiết về "dữ liệu người dùng" và "mối quan hệ xã hội" và ví dụ cụ thể về cách bạn muốn truy vấn hoặc tổng hợp dữ liệu của mình, có rất ít câu trả lời ở đây ngoài "Có, bạn có thể làm điều đó và nó sẽ hữu ích" . – karmi

+0

dữ liệu người dùng như trong thông tin đăng nhập, mật khẩu, thông tin tiểu sử. Dữ liệu xã hội bao gồm danh sách những người theo dõi và những người theo dõi họ. Cùng một loại mối quan hệ hướng dẫn bạn sẽ tìm thấy trong Twitter. – onejigtwojig

Trả lời

3

Tôi muốn nói tiếp và lưu tất cả thông tin đó trong ElasticSearch CHỈ nếu bạn có thể bảo mật cơ sở dữ liệu bằng cách nào đó. AFAIK, ES không hỗ trợ bất kỳ phương pháp bảo mật ứng dụng nào thông qua xác thực, khóa, v.v. Vì vậy, nếu bạn không thể bảo mật dữ liệu đó, bạn chắc chắn không muốn đặt bất kỳ chi tiết đăng nhập người dùng nào trong đó.

Trong ứng dụng của mình, tôi đã chặn truy cập cổng vào cá thể ES của mình chỉ với máy chủ cục bộ. Sau đó, tôi đã xây dựng một lớp dịch vụ trên đầu trang của ES trong node.js. Tất cả xác thực của tôi được xử lý trước khi tôi truy cập vào lớp dữ liệu.

Một điều về ES là nhiều dữ liệu hơn không nhất thiết làm chậm truy vấn trừ khi bạn lập chỉ mục tất cả dữ liệu đó hoặc truy vấn. Nếu bạn chỉ cần truy xuất dữ liệu đó, thì bạn luôn có thể lấy tài liệu "_source". Hãy chắc chắn rằng bạn có không gian đĩa để xử lý dữ liệu của bạn, nhưng khác hơn thế, tôi muốn nói lưu tất cả - và được chiến lược trong những gì bạn chỉ mục và làm thế nào.

+0

Cảm ơn mẹo. Tôi không tin ES có cơ chế bảo mật. Tôi sẽ làm theo và phù hợp với truy cập cổng vào ES. Cảm ơn! – onejigtwojig

+0

Ngoài ra, không phải mọi tài liệu được thêm vào Tìm kiếm Đàn hồi sẽ tự động được lập chỉ mục? Không chắc chắn những gì bạn có nghĩa là chỉ cần lấy tài liệu "_source". Sẽ phải xem xét các tài liệu cẩn thận hơn .. – onejigtwojig

+0

Vâng, "phân tích" sẽ là một cách tốt hơn để đặt điều đó. Nếu bạn có nhiều thuộc tính cần được phân tích văn bản, điều đó sẽ làm chậm truy vấn của bạn. Khi bạn lấy tài liệu từ ES, một trong các thuộc tính trả về là "_source" - có toàn bộ tài liệu trong đó. – swatkins

Các vấn đề liên quan