2012-11-28 31 views
15

Tôi đã đọc về cách sử dụng Solr và Mahout để phát triển Hệ thống đề xuất.Hệ thống đề xuất sử dụng Solr và Mahout

Như tôi đã hiểu, họ xử lý hai vấn đề khác nhau.

  1. Kể từ Solr là một công cụ tìm kiếm + phân loại hệ thống, nó được sử dụng chủ yếu cho các khuyến nghị như "nhiều như thế này" trong Drupal - http://jamidwyer.com/d7/node/21.

(hoặc "liên quan" trong StackOverflow)

  1. Trong trường hợp của Mahout, nó thực hiện các thuật toán học máy như hợp tác Filtering.It có thể được sử dụng để thực hiện các tính năng như gợi ý ở Amazon dựa trên các thành viên hoạt động trước đó. (thích, mua các mặt hàng)

câu hỏi của tôi,

có phải họ sử dụng để giải quyết hai vấn đề khác nhau?

Chúng có thể được tích hợp không?

Tôi đọc Mahout xử lý ngoại tuyến và có thể mở rộng. Điều này có nghĩa là Solr không thể được thu nhỏ?

+0

lý do tại sao bình chọn cho đóng cửa? im chắc chắn đây là một câu hỏi kiến ​​trúc chung bất cứ ai mới để Solr và Mahout –

+0

Nó không phải là một câu hỏi xấu mỗi se, chỉ cần không phù hợp cho SO. –

Trả lời

3

bạn nói đúng họ giải quyết hai vấn đề khác nhau và cho đến nay tôi chưa thấy/tìm thấy bất kỳ tích hợp hiện có nào sẽ hoạt động ra khỏi hộp.

Những gì bạn có thể làm là sử dụng kết quả phân loại Mahout để thêm thông tin vào tài liệu được lập chỉ mục của bạn, sau đó có thể được sử dụng để thúc đẩy mục đích.

Về câu trả lời cuối cùng của bạn - Solr có thể mở rộng, với phiên bản vừa phát hành 4.0, nó thậm chí có thể mở rộng tốt hơn trước đó. Nhưng nó giải quyết một mục đích khác nhau và quy mô tốt cho nó.

Câu hỏi của bạn có một chút không xác định nên tôi hy vọng điều này sẽ giúp ích theo một cách nào đó.

Chúc mừng

11

Đây là những công cụ khác nhau cho các vấn đề khác nhau. Solr không thực sự đưa ra các khuyến nghị, nó gợi ý các tài liệu tương tự dựa trên nội dung. Điều này không được cá nhân hóa theo nghĩa là nó không liên quan đến người dùng. Nó rất tốt ở vấn đề cụ thể này.

Hương vị/Mahout dành cho lọc cộng tác, không dành riêng cho tài liệu hoặc bất kỳ loại điều nào khác, và khác biệt quan trọng trong "mục tương tự" và đề xuất dựa trên tương tác của người dùng chứ không phải thuộc tính mục.

Cả hai quy mô tốt, tùy thuộc vào những gì bạn cần và có ý nghĩa. Không có lý do gì để nghi ngờ Solr.

Về Mahout và giới thiệu, một thời gian ngắn, nó có hai phần. Một mẩu (Taste) là thời gian thực, không phải dựa trên Hadoop và quy mô để tập hợp dữ liệu vừa phải (có thể là 10M điểm dữ liệu) trên một máy. Mahout sau đó bổ sung thêm việc triển khai hàng loạt dựa trên Hadoop, không theo thời gian thực, có thể mở rộng quy mô lớn hơn. (Quảng cáo: Tôi là tác giả chính của những điều trên, và đang làm việc trên một hệ thống thế hệ tiếp theo dựa trên cả hai được gọi là Myrrix. Nó sẽ hấp dẫn nếu bạn quan tâm đến cả người đề xuất theo phong cách Mahout theo thời gian thực và có thể mở rộng.)

Nếu bạn quan tâm đến một công ty đặt cùng một nền tảng dựa trên trên, bao gồm cả Solr, bạn nên xem NGDATA.

2

Nếu bạn sẵn sàng để có được bàn tay của bạn bẩn, bạn thực sự có thể sử dụng Solr + Collaborative Filtering để thực hiện một hệ thống đề nghị tìm kiếm thực sự ngọt ngào. Tức là, được tìm kiếm S và được cung cấp lịch sử mua hàng của người tìm kiếm P_i và cung cấp lịch sử mua hàng của mọi người khác P_j nơi j≠i. Sau đó, bạn có thể trả lại kết quả đáp ứng tìm kiếm S nhưng được tăng dựa trên các mục mà người tìm kiếm có thể muốn dựa trên những người dùng tương tự khác.

Dưới đây là một bài đăng blog mà tôi đã viết rằng có thể chỉ cho bạn đi đúng hướng: http://opensourceconnections.com/blog/2013/10/05/search-aware-product-recommendation-in-solr/

+0

Đọc blog rất hay. –

Các vấn đề liên quan