Tôi hiện đang nghiên cứu các hệ thống giới thiệu và muốn biết các nhà nghiên cứu khác có được hoặc tạo ra dữ liệu thử nghiệm để đánh giá hiệu suất của hệ thống như thế nào?Cách lấy hoặc tạo dữ liệu thử nghiệm cho hệ thống giới thiệu
10
A
Trả lời
7
Tôi không biết bạn đang đánh giá trường nào, nhưng nếu là đề xuất phim, bạn có thể sử dụng MovieLens data từ GroupLens để bắt đầu. (Có vẻ như trang web của họ tạm thời ngừng hoạt động, nhưng tôi chắc chắn rằng trang web sẽ sớm được sao lưu).
Họ có ba bộ dữ liệu - 100.000 phiếu (sở thích), 1 triệu và 10 triệu - và có vẻ như chúng ít nhiều tiêu chuẩn mà mọi người bắt đầu.
8
Khi tôi đang làm việc với Recommender Systems, tôi gặp vấn đề tương tự. Tôi rất thích Grouplens DataSet nhất:
Bạn có thể tải xếp hạng do người dùng phim.
Ngoài ra, tôi mô tả trong blog của tôi một số bộ dữ liệu tôi tìm thấy trong khi nghiên cứu:
http://girlincomputerscience.blogspot.com.br/2010/12/datasets.html
Hy vọng nó sẽ giúp!
Các vấn đề liên quan
- 1. Hệ thống giới thiệu trang web
- 2. Hệ thống tệp giả cho thử nghiệm đơn vị Perl
- 3. hệ thống thử nghiệm đơn vị.timers.timer
- 4. DSL để tạo dữ liệu thử nghiệm
- 5. Giới thiệu về hệ thống đại số máy tính?
- 6. Tạo dữ liệu giả cho thử nghiệm đơn vị
- 7. Tạo dữ liệu thử nghiệm trong cơ sở dữ liệu
- 8. Có khả thi để giới thiệu Phát triển theo hướng thử nghiệm (TDD) trong một dự án trưởng thành không?
- 9. Tạo dữ liệu thử nghiệm trong SQL Server
- 10. Có ai có thể giới thiệu một trình tạo dữ liệu tổng hợp không?
- 11. Quản lý dữ liệu thử nghiệm cho các thử nghiệm của Junit
- 12. Hệ thống tập tin giả trong thử nghiệm tích hợp
- 13. Đồ đạc thử nghiệm hoặc tương đương với dữ liệu thử nghiệm với Smalltalk Seaside?
- 14. Cung cấp dữ liệu thử nghiệm cho SharedPreferences cho Robolectric
- 15. Làm thế nào để viết thử nghiệm hệ thống tự động với C#?
- 16. Tạo dữ liệu thử nghiệm từ một REGEX
- 17. Chrome.History lấy URL giới thiệu (JS)
- 18. Bộ dữ liệu để tạo dữ liệu ngẫu nhiên/thử nghiệm thực tế
- 19. Giới thiệu hoặc ví dụ đơn giản cho iteratee?
- 20. Mối quan hệ tự giới thiệu Django?
- 21. Laravel tạo cơ sở dữ liệu khi thử nghiệm
- 22. cách nhập dữ liệu vào mạng PyBrain được đào tạo và thử nghiệm và cách lấy kết quả
- 23. Chia sẻ hệ thống dữ liệu rộng
- 24. Cách Thông báo cho Trình duyệt web Giới thiệu về Nguồn cấp dữ liệu Atom
- 25. Làm cách nào để lấy MSTest để tìm các tệp dữ liệu thử nghiệm của tôi?
- 26. Cơ sở dữ liệu cho hệ thống nhúng
- 27. Cách lấy Màu Hệ thống Android
- 28. Giới thiệu người mới bắt đầu để thử nghiệm đơn vị trong Visual Studio 2008
- 29. Hệ thống cơ sở dữ liệu không quan hệ
- 30. Cách đọc tệp có dữ liệu thử nghiệm bằng Clojure?
Tuyệt vời! Cảm ơn bạn về thông tin. Điều gì sẽ xảy ra nếu mọi người đang tìm kiếm một tập dữ liệu được dựa trên mục chứ không phải dựa trên xếp hạng? VÍ DỤ. Bộ lọc cộng tác so với lọc nội dung/lọc mục/khôi phục thông tin. – user1260160
Ý của bạn là gì? Bộ Grouplens cũng có thể được sử dụng để lọc cộng tác. – Eyal