(Tôi nghĩ rằng đây là câu hỏi tương tự như bạn chỉ hỏi về [email protected]? Sao chép câu trả lời của tôi.)
Bạn có thể không cần Hadoop ở tất cả, và nếu bạn không, Tôi khuyên bạn không nên sử dụng nó để đơn giản. Đó là "điều ác cần thiết" để vượt qua một điểm nhất định.
Bạn có thể có dữ liệu trên Cassandra nhưng bạn sẽ muốn có thể đọc nó vào bộ nhớ. Nếu bạn có thể kết xuất dưới dạng tệp, bạn có thể sử dụng FileDataModel. Hoặc, bạn có thể mô phỏng mã trong FileDataModel để tạo mã dựa trên Cassandra.
Sau đó, hai nhu cầu của bạn có thể dễ dàng trả lời:
Đây không phải là ngay cả một khuyến nghị vấn đề. Chỉ cần chọn triển khai của UserSimilarity và sử dụng nó để so sánh người dùng với tất cả những người khác và chọn những người có độ tương đồng cao nhất . (Bao gói với CachingUserSimilarity sẽ giúp một lô hàng .)
Đây chỉ là một vấn đề giới thiệu . Sử dụng GenericUserBasedRecommender với UserSimilarity và DataModel của bạn và bạn đã hoàn tất.
Tất nhiên điều này có thể phức tạp hơn nhiều so với điều này, nhưng đây là điểm bắt đầu tốt.
Nếu sau này bạn sử dụng Hadoop, có bạn phải thiết lập Hadoop theo hướng dẫn của Hadoop. Không có "thiết lập" Mahout. Đối với những người giới thiệu, bạn sẽ xem xét một trong các lớp RecommenderJob để gọi các công việc cần thiết trên cụm Hadoop của bạn. Bạn sẽ chạy nó với lệnh "hadoop" - một lần nữa, đây là nơi bạn cần phải hiểu Hadoop.
Cuốn sách Mahout in Action viết hầu hết các công việc của Mahout Hadoop một cách chi tiết.
Nguồn
2011-01-13 11:01:55