Tôi xây dựng một hệ thống đề xuất đơn giản cho MovieLens DB lấy cảm hứng từ https://databricks-training.s3.amazonaws.com/movie-recommendation-with-mllib.html.Làm thế nào để cập nhật Spark MatrixFactorizationModel cho ALS
Tôi cũng gặp vấn đề với đào tạo rõ ràng như sau: Apache Spark ALS collaborative filtering results. They don't make sense Sử dụng đào tạo tiềm ẩn (trên cả dữ liệu rõ ràng và tiềm ẩn) cho tôi kết quả hợp lý, nhưng đào tạo rõ ràng thì không.
Trong khi điều này là ok cho tôi bây giờ, im tò mò về cách cập nhật mô hình. Trong khi giải pháp hiện tại của tôi hoạt động như
- có tất cả xếp hạng người dùng
- tạo mô hình
- nhận đề xuất cho người sử dụng
Tôi muốn có một dòng như thế này:
- có cơ sở xếp hạng
- tạo mô hình một lần (tùy chọn lưu & tải nó)
- nhận được một số xếp hạng bởi một người dùng trên 10 phim ngẫu nhiên (không có trong mô hình!)
- nhận đề xuất sử dụng mô hình và xếp hạng người dùng mới
Vì vậy, tôi phải cập nhật mô hình của tôi, mà không hoàn toàn recompute nó. Có cơ hội để làm như vậy không?
Trong khi cách đầu tiên tốt cho xử lý theo lô (như tạo đề xuất theo lô hàng đêm), cách thứ hai sẽ tốt cho việc tạo các đề xuất gần như trực tiếp.
Xem thêm những câu hỏi này tương tự http://stackoverflow.com/questions/28724639/how-to-augment-matrix-factors-in-spark- als-recommender –
Ngoài ra, http://stackoverflow.com/questions/40809876/apache-spark-als-how-to-perform-live-recommendations-fold-in-anonym-user?rq=1 –