2008-09-10 26 views
19

Tôi đã đọc cuốn sách Programming Collective Intelligence và thấy nó hấp dẫn. Gần đây tôi đã nghe nói về một thách thức amazon đã được đăng trên thế giới để đưa ra một công cụ đề xuất tốt hơn cho hệ thống của họ.Điều gì sẽ được xem xét khi xây dựng một Công cụ đề xuất?

Người chiến thắng dường như đã tạo ra thuật toán tốt nhất bằng cách giới hạn lượng thông tin đang được cấp cho nó.

Như quy tắc đầu tiên, tôi đoán ... "Thông tin khác không nhất thiết phải tốt hơn khi nói đến thuật toán mờ."

Tôi biết đó là chủ quan, nhưng cuối cùng đó là điều có thể đo lường (số lần nhấp để phản hồi các đề xuất).

Vì hầu hết chúng ta đang xử lý web những ngày này và tìm kiếm có thể được coi là một hình thức giới thiệu ... Tôi nghi ngờ tôi không phải là người duy nhất đánh giá cao ý tưởng của người khác về điều này.

Tóm lại, "Cách tốt nhất để xây dựng đề xuất là gì?"

Trả lời

5

Bạn không muốn sử dụng "mức độ phổ biến chung" trừ khi bạn không có thông tin về người dùng. Thay vào đó, bạn muốn căn chỉnh người dùng này với người dùng và trọng lượng tương tự cho phù hợp.

Đây chính xác là những gì Bayesian Inference thực hiện. Trong tiếng Anh, điều đó có nghĩa là điều chỉnh xác suất tổng thể bạn sẽ thích thứ gì đó (xếp hạng trung bình) với xếp hạng từ những người khác thường bỏ phiếu theo cách của bạn cũng như.

Một lời khuyên khác, nhưng lần này quảng cáo học: Tôi thấy rằng có những người mà nếu họ thích điều gì đó tôi gần như chắc chắn sẽ là không phải thích nó. Tôi không biết liệu hiệu ứng này có thật hay tưởng tượng hay không, nhưng có thể sẽ rất thú vị khi xây dựng một loại "hiệu ứng tiêu cực" thay vì chỉ làm cho mọi người gầy gò bởi sự giống nhau.

Cuối cùng, có một công ty chuyên về chính xác tên gọi này là SenseArray. Chủ sở hữu (Ian Clarke của freenet fame) rất dễ tiếp cận. Bạn có thể sử dụng tên của tôi nếu bạn gọi anh ta lên.

+1

đó là định nghĩa không chính xác của suy luận Bayes. Suy luận Bayes đưa bạn từ một ý kiến ​​trước đến một ý kiến ​​cập nhật, dựa trên dữ liệu. Đó là quá rộng của một ứng dụng để trả lời câu hỏi của @ Allain. – isomorphismes

5

Có toàn bộ khu vực nghiên cứu về khoa học máy tính dành cho chủ đề này. Tôi muốn đề nghị đọc some articles.

5

Đồng ý với @Ricardo. Câu hỏi này quá rộng, chẳng hạn như hỏi "Cách tốt nhất để tối ưu hóa hệ thống là gì?"

Một tính năng phổ biến cho gần như tất cả các công cụ đề xuất hiện tại là việc đưa ra đề xuất cuối cùng sẽ tóm tắt để nhân một số ma trận và vectơ. Ví dụ: nhân một ma trận có chứa trọng số gần nhau giữa những người dùng bằng một vectơ xếp hạng mục.

(Tất nhiên bạn phải sẵn sàng cho hầu hết các vectơ của bạn sẽ được siêu thưa thớt!)

câu trả lời của tôi là chắc chắn quá muộn cho @Allain nhưng đối với những người dùng khác tìm câu hỏi này thông qua tìm kiếm - gửi cho tôi một PM và hỏi một câu hỏi cụ thể hơn và tôi chắc chắn sẽ trả lời.

(động cơ tôi thiết kế giới thiệu một cách chuyên nghiệp.)

2

@Lao Tử, tôi đồng ý với bạn.

Theo tôi, động cơ khuyến nghị được tạo thành từ:

  • Context Input ăn từ hệ thống nhận biết ngữ cảnh (đăng nhập tất cả dữ liệu của bạn)
  • lập luận logic để lọc rõ ràng nhất
  • Expert các hệ thống cải thiện dữ liệu chủ quan của bạn trong khoảng thời gian dựa trên đầu vào ngữ cảnh và
  • Lý do xác suất để đưa ra quyết định gần đúng dựa trên tổng trọng số của các hành động trước đó (bel iefs, ham muốn, & ý định).

P.S. Tôi đã thực hiện công cụ đề xuất đó.

Các vấn đề liên quan