Tôi đang sử dụng KNN để phân loại chữ số viết tay. Tôi cũng đã thực hiện PCA để giảm kích thước. Từ 256 tôi đã đi đến 200. Nhưng tôi chỉ nhận thấy như, mất 0,10% thông tin. Tôi đã xóa 56 thứ nguyên. Không nên mất lớn hơn? Chỉ khi tôi rơi xuống 5 kích thước tôi mới nhận được khoản lỗ ~ 20%. Điều này có bình thường không?Thuật toán PCA và KNN
Trả lời
Bạn đang nói rằng sau khi xóa 56 thứ nguyên, bạn đã mất gần như không có thông tin? Tất nhiên, đó là điểm của PCA! Principal Component Analysis, như trạng thái tên, giúp bạn xác định thứ nguyên nào mang thông tin. Và bạn có thể loại bỏ phần còn lại, làm cho phần lớn nhất của nó.
Tôi muốn một số ví dụ, trong phân tích gen, tôi đã đọc các giấy tờ mà kích thước được giảm từ 40'000 xuống 100 với PCA, sau đó chúng thực hiện một số công cụ kỳ diệu và có bộ phân loại tuyệt vời với 19 kích thước. Điều này ngầm cho bạn biết rằng họ đã mất hầu như không có thông tin khi họ loại bỏ kích thước 39'900!
ok cảm ơn. Tôi mới học máy –
Điều đó là bình thường, có (và giống như Fezvez đã nói điểm của những gì bạn đã làm). Trường hợp của bạn thực sự là một ví dụ tốt, nơi bạn có thể xem như thế nào là có thể.
Hãy xem dữ liệu của bạn (điều đó luôn quan trọng trong học máy, biết dữ liệu của bạn). Nếu bạn có hình ảnh chữ viết tay màu đen trên nền trắng, có khả năng cao là các pixel ở một số góc có màu trắng cho tất cả các mẫu (tôi đã có ở một góc khi tôi đã học máy bằng chữ số viết tay). Vì vậy, thực sự không có thông tin nào trong pixel đó. Nếu bạn thả nó như là đầu vào cho KNN hoặc ANN của bạn hoặc bất cứ điều gì, bạn sẽ có kết quả tương tự.
- 1. OpenCV PCA Tính toán bằng Python
- 2. K Thuật toán lân cận gần nhất
- 3. Thuật toán và cấu trúc dữ liệu
- 4. RGB to CMYK và thuật toán ngược
- 5. Thuật toán giải mã chấm và hộp
- 6. Sử dụng thuật toán nào: Thuật toán băm được quản lý và không được quản lý
- 7. Thuật toán Eppstein và thuật toán của Yen cho k đường đi ngắn nhất
- 8. Thuật toán xấp xỉ phức tạp Kolmogorov Thuật toán
- 9. Vẽ các cặp khớp trong tính toán hình ảnh của KNN và lỗi tiềm ẩn trong Features2DToolbox.DrawMatches
- 10. Giải thuật cây/Thuật toán đệ quy
- 11. Thực hiện PCA trong Java
- 12. Boolean satisfiability - thuật toán
- 13. Cân bằng PCA với ggbiplot
- 14. Thuật toán số Chuông
- 15. Thuật toán phổ biến
- 16. Thuật toán phổ biến
- 17. Thuật toán xếp hạng
- 18. Video thuật toán hay
- 19. Thuật toán trong C
- 20. Thuật toán Khác biệt
- 21. Thuật toán của Lucene
- 22. Thuật toán Object.hashCode()
- 23. Thuật toán kỹ thuật Facebook Bigpipe
- 24. Thuật toán đề xuất
- 25. Thuật toán để tính toán chế độ
- 26. Thuật toán smbPitchShift (Pascal)
- 27. Thuật toán tăng :: toán học :: erf
- 28. Thuật toán Minimax
- 29. Nhanh thuật toán sigmoid
- 30. thuật toán kết hợp
Loại điều đó phổ biến trong nhiều loại ứng dụng. Nó được gọi là điểm lợi nhuận giảm dần. –