Tôi sử dụng triển khai python của XGBoost. Một trong những mục tiêu là rank:pairwise
và nó giảm thiểu tổn thất theo cặp (Documentation). Tuy nhiên, nó không nói bất cứ điều gì về phạm vi của đầu ra. Tôi thấy con số từ -10 đến 10, nhưng nó có thể là nguyên tắc-inf để inf?Đầu ra của XGboost sử dụng 'rank: pairwise' là gì?
Trả lời
câu hỏi hay. bạn có thể có một cái nhìn trong kaggle competition:
Thực tế, trong phần Học để xếp hạng, chúng tôi đang cố gắng dự đoán điểm số tương đối cho từng tài liệu cho một truy vấn cụ thể. Đó là, đây không phải là một vấn đề hồi quy hoặc vấn đề phân loại. Do đó, nếu một tài liệu, gắn liền với một truy vấn, nhận được một số dự đoán tiêu cực, nó có nghĩa và chỉ có nghĩa là nó tương đối ít so với truy vấn, khi so sánh với các tài liệu khác, với điểm số dương.
hy vọng bây giờ là ok –
Nếu tôi hiểu chính xác qns của bạn, bạn có nghĩa là đầu ra của hàm dự đoán trên mô hình được trang bị xếp hạng: pairwise.
Dự đoán đưa ra biến được dự đoán (yhat).
Điều này giống với reg: tuyến tính/nhị phân: hậu cần vv. Sự khác biệt duy nhất là reg: tuyến tính xây dựng cây thành phút (rmse (y, yhat)), trong khi xếp hạng: ghép đôi cây để tối đa (bản đồ (xếp hạng (y), xếp hạng (yhat))). Tuy nhiên, đầu ra luôn luôn là yhat.
Tùy thuộc vào giá trị của các biến phụ thuộc của bạn, đầu ra có thể là bất kỳ thứ gì. Nhưng tôi thường mong đợi đầu ra sẽ nhỏ hơn nhiều so với biến phụ thuộc. Đây thường là trường hợp không nhất thiết phải phù hợp với các giá trị dữ liệu cực đoan, cây chỉ cần tạo ra các yếu tố dự đoán đủ lớn/nhỏ để được xếp hạng đầu tiên/cuối cùng trong nhóm
. Tuy nhiên, điểm số chỉ hợp lệ để xếp hạng trong các nhóm của riêng họ. Vì vậy, chúng tôi phải đặt các nhóm cho dữ liệu đầu vào.
Để xếp hạng esay, hãy tham khảo dự án của tôi xgboostExtension
- 1. Cơ chế sử dụng param 'scale_pos_weight' trong xgboost là gì?
- 2. hồi quy đầu ra muti trong xgboost
- 3. Đầu ra của mã sau là gì?
- 4. Sử dụng XGBOOST trong C++
- 5. Sử dụng một monadic rank-2 loại
- 6. "Đa" trong đầu ra của Webpack là gì?
- 7. Sử dụng đầu ra cURL
- 8. Tại sao đầu ra shell thường sử dụng `mixed_characters 'trong đầu ra của nó?
- 9. adb shell dumpsys meminfo - Ý nghĩa của mỗi ô của đầu ra của nó là gì?
- 10. Sử dụng làm phiên bản ban đầu là gì?
- 11. việc sử dụng của `self.Clients.claim() là gì '
- 12. Sử dụng giá trị 'ban đầu' trong CSS là gì?
- 13. Lịch sử ban đầu của khuôn khổ .Net là gì?
- 14. Sử dụng đầu ra của lệnh shell làm biến số
- 15. Tách đầu ra của ps bằng cách sử dụng Python
- 16. clf.tree_.feature - đầu ra là gì? (scikit-learn)
- 17. Sự khác nhau giữa hàm RANK() và DENSE_RANK() trong oracle là gì?
- 18. "cout << cout" - giá trị đầu ra là gì?
- 19. Ý nghĩa của đầu ra mặc định của manage.py runserver là gì?
- 20. Lý do cho đầu ra này là gì?
- 21. Ý nghĩa của thời gian đầu vào đồng thời của luồng trong đầu ra profiler là gì?
- 22. Cách sử dụng đầu ra xsd.exe/c
- 23. "Chuyển hướng đầu ra mơ hồ" có nghĩa là gì?
- 24. Hiểu Linux đầu CPU sử dụng đầu ra
- 25. Cách sử dụng cú pháp đầu ra
- 26. Pandas dày đặc RANK
- 27. là gì lĩnh vực số phiên bản trong đầu ra của lệnh tập tin Linux
- 28. Ưu điểm của việc sử dụng Automapper là gì?
- 29. Nội bộ của Pythons str.join() là gì? (Ẩn mật khẩu từ đầu ra)
- 30. Giá trị của 'lá' trong sơ đồ cây mô hình xgboost sau đây có nghĩa là gì?
u tìm thấy đầu ra là gì? –
Không. Tôi chưa tìm được câu trả lời. –