2009-10-20 36 views
7

Tôi muốn chơi xung quanh với việc xây dựng hệ thống đề xuất và theo đó tôi có nghĩa là thuật toán xem xét tùy chọn và/hoặc đánh giá do người dùng đăng và sau đó đưa ra đề xuất cho họ, tương tự như sử dụng netflix hoặc amazon.Tôi có thể tìm hiểu về hệ thống đề xuất ở đâu?

Một số tài nguyên tốt để tìm hiểu cách viết một cái gì đó như thế này? Tôi nên bắt đầu từ đâu?

Trả lời

5

Kiểm tra trang Wikipedia trên Netflix Prizediscussion forum của trang Wikipedia. Ngoài ra, phần có liên quan 2009 GitHub Contest là một nguồn tốt cho mã nguồn đầy đủ trên một số công cụ đề xuất khác nhau. Và rõ ràng là cũng có Wikipedia page on the topic itself, trong đó có một số liên kết phong nha.

Nếu bạn bắt đầu viết của riêng mình, bạn sẽ muốn sử dụng một kho văn bản. Tôi thực sự khuyên bạn nên sử dụng Netflix Prize's data set. Chỉ cần khắc dữ liệu được đặt thành hai phần. Đào tạo trên mảnh đầu tiên và điểm số thuật toán của bạn trên mảnh thứ hai.

Addenda: Một ứng dụng nào liên quan và đáng sợ của các loại điều này là predicting demographic information: giới tính, tuổi tác, thu nhập hộ gia đình, chỉ số IQ, khuynh hướng tình dục của người dùng, vv Bạn có thể có thể làm hầu hết những thuộc tính này với giải Netflix tập dữ liệu với độ chính xác khá cao. May mắn thay everyone in that dataset is just a number.

+0

Điều gì đáng sợ về điều đó? Nhà tiếp thị cố gắng dự đoán bạn mọi lúc dựa trên trình duyệt, IP và thông tin khác của bạn từ tiêu đề HTTP. Nó không phải là thông tin thực tế, chỉ là "các khuôn mẫu được thông báo" (Bay có điều kiện). – isomorphismes

+1

Vì dữ liệu được biểu thị là 'ẩn danh' nhưng thực ra không phải là? Điều này đặc biệt xấu nếu người dùng không bao giờ chọn tham gia vào dữ liệu của họ đang được chia sẻ. –

+0

Tôi có thể không hiểu chính xác những gì bạn muốn nói. Bạn đang nói giấu tên đã bị vi phạm vì tôi có thể đoán chính xác các đặc điểm nhân khẩu học của người dùng 2871875 không? – isomorphismes

Các vấn đề liên quan