hệ thống đề xuất dựa trên xếp hạng sử dụng NDCG để đánh giá độ chính xác của Đề xuất. Tuy nhiên, đôi khi tỷ lệ chính xác và tỷ lệ thu hồi được sử dụng để đánh giá đề xuất hàng đầu. Có nghĩa là khi NDCG cao, tỷ lệ chính xác cao? Nhưng tôi chạy thuật toán ListRankMF, tỷ lệ chính xác rất thấp trên dữ liệu movelens 100k, chỉ khoảng 8%. Mối quan hệ giữa NDCG và tỷ lệ chính xác là gì?Tại sao khuyến nghị dựa trên xếp hạng sử dụng NDCG?
Trả lời
NDCG hữu ích nhất khi mục tiêu của hệ thống giới thiệu là trả về một số kết quả có liên quan và thứ tự là quan trọng. Ví dụ: giới thiệu bản dịch hoặc đề xuất tài khoản ngân hàng. Nó không có hại nếu chúng ta bỏ lỡ kết quả có liên quan, nhưng để có trải nghiệm người dùng tốt, chúng tôi muốn chúng theo thứ tự có ý nghĩa.
Gọi lại hữu ích nhất khi mục tiêu của hệ thống giới thiệu là trả lại tất cả các kết quả có liên quan và thứ tự không quan trọng. Ví dụ, một chẩn đoán y tế tiềm năng hoặc theo toa. Nó là có hại nếu chúng ta bỏ lỡ một kết quả có liên quan, vì đó có thể là chẩn đoán hoặc chữa bệnh đúng. Trình tự này không quan trọng vì chúng tôi hy vọng các bác sĩ sẽ đọc qua tất cả các khả năng và sử dụng kiến thức chuyên môn của họ cho quyết định cuối cùng.
Giả sử có 5 loại thuốc chúng tôi có thể đề nghị bác sĩ cho bệnh nhân (từ A đến E) và 5 mà chúng tôi không khuyến cáo (F đến J). Hệ thống giới thiệu của chúng tôi đưa ra các khuyến nghị A, B, C, D. Điều này cho phép chúng ta đánh giá như sau:
- NDCG = 1,0
- Nhớ lại = 0,8
Trong trường hợp này nhớ lại rõ ràng cho thấy chúng tôi đã không làm tốt như chúng ta có thể (vì chúng tôi không khuyên bạn nên thuốc E), trong khi NDCG dẫn chúng ta đến tin rằng chúng tôi đã đưa ra các khuyến nghị hoàn hảo.
Nếu chúng tôi thay vào đó giới thiệu sách, thì NDCG sẽ phù hợp hơn. Nhớ lại không quá nhiều thông tin vì có thể có hàng trăm cuốn sách có liên quan, nhưng chúng tôi không thể mong đợi người dùng đọc qua danh sách hàng trăm cuốn sách để chỉ chọn một cuốn sách để đọc. NDCG sẽ cho chúng tôi biết nếu chúng tôi ít nhất đề xuất một số tập hợp có ý nghĩa về những gì có thể.
- 1. Khuyến nghị của Apache Spark ALS
- 2. Bảng xếp hạng dựa trên facebook
- 3. Tại sao tslint: khuyến nghị không cho phép mô-đun?
- 4. C++ chat bot xếp hạng dựa trên trả lời?
- 5. Tạo 'hàng xóm' cho người dùng dựa trên xếp hạng
- 6. Xếp hạng sao JQuery
- 7. Xếp hạng Mysql dựa trên Danh mục và Chi nhánh
- 8. được sử dụng để tính xếp hạng 5 sao
- 9. Viết một máy chủ dựa trên socket trong Python, các chiến lược được khuyến nghị?
- 10. Khuyến nghị sử dụng chú thích @Required của Spring
- 11. Làm thế nào để làm một mục dựa trên khuyến nghị trong mllib tia lửa?
- 12. Trải nghiệm và khuyến nghị của Icenium
- 13. Symfony2 và Vim khuyến nghị
- 14. Khuyến nghị cho việc phát triển Python trên máy Mac?
- 15. Khuyến nghị cho Java + OpenPGP?
- 16. COM + vẫn được khuyến nghị?
- 17. Khuyến nghị cho C Profilers?
- 18. Tại sao h, j, k, l được khuyến nghị sử dụng các phím mũi tên cho vim?
- 19. Tại sao đặt kho git bên trong thư mục Dropbox không được khuyến nghị?
- 20. Tại sao tài sản Accesing trực tiếp không được khuyến nghị trong OOPs PHP?
- 21. Khuyến nghị cho một công cụ hỗ trợ để sử dụng với Lucene hoặc Solr?
- 22. vô hiệu xếp hạng trên RatingBar
- 23. Twitter Bootstrap rtl xếp hạng sao
- 24. Django Facebook Connect App Khuyến nghị
- 25. Tại sao thêm một không gian hàng đầu trong chuỗi định dạng scanf được khuyến nghị?
- 26. Khuyến nghị mở rộng tệp Twig
- 27. Laravel 5 - Mercurial được khuyến nghị .hgignore
- 28. là SICP vẫn được khuyến nghị?
- 29. Cách được khuyến nghị để có được winhttp.h là gì?
- 30. Khung ứng dụng web nào cho Delphi được khuyến nghị?