Tôi đang phân loại dữ liệu nhị phân và tôi muốn biết những ưu điểm và nhược điểm của việc sử dụng máy vectơ hỗ trợ trên cây quyết định và thuật toán tăng cường thích ứng.Ưu điểm của SVM trên cây decion và thuật toán AdaBoost
Trả lời
Điều bạn có thể muốn làm là sử dụng weka, đây là một gói hay mà bạn có thể sử dụng để cắm dữ liệu của mình và sau đó thử một loạt các trình phân loại học máy khác nhau để xem cách hoạt động của từng bộ. Đó là một con đường tốt cho những người học máy.
Không biết gì về dữ liệu cụ thể của bạn hoặc vấn đề phân loại bạn đang cố gắng giải quyết, tôi thực sự không thể chỉ nói cho bạn những điều ngẫu nhiên mà tôi biết về từng phương pháp. Điều đó nói rằng, đây là một bãi chứa não và liên kết đến một số slide học máy hữu ích.
Adaptive Boosting sử dụng một ủy ban phân loại cơ sở yếu để bỏ phiếu cho việc phân loại lớp của điểm mẫu. Các bộ phân loại cơ bản có thể là các gốc quyết định, cây quyết định, SVM, vv .. Nó có một cách tiếp cận lặp đi lặp lại. Trên mỗi lần lặp lại - nếu ủy ban có thỏa thuận và chính xác về việc gán lớp cho một mẫu cụ thể, thì nó trở nên giảm trọng số (ít quan trọng để có quyền trong lần lặp tiếp theo), và nếu ủy ban không thỏa thuận thì nó sẽ trở thành tăng trọng (quan trọng hơn để phân loại ngay trên lần lặp tiếp theo). Adaboost được biết đến là có sự tổng quát tốt (không overfitting).
SVMs là lần thử đầu tiên hữu ích. Ngoài ra, bạn có thể sử dụng các hạt nhân khác nhau với SVM và không chỉ là ranh giới quyết định tuyến tính mà còn có nhiều hình dạng thú vị hơn. Và nếu bạn đặt L1-regularization trên nó (các biến slack) thì bạn không chỉ có thể ngăn chặn overfitting, mà còn, bạn có thể phân loại dữ liệu không thể tách rời.
Decision trees hữu ích vì tính giải thích của chúng chỉ bằng bất kỳ ai. Rất dễ dàng để sử dụng chúng. Sử dụng cây cũng có nghĩa là bạn cũng có thể nhận được một số ý tưởng về mức độ quan trọng của một tính năng cụ thể để tạo ra cây đó. Một cái gì đó bạn có thể muốn kiểm tra là cây phụ gia (như MART).
"nếu ủy ban có thỏa thuận về việc gán lớp cho một mẫu cụ thể thì nó sẽ bị giảm trọng số". Điều này không đúng. Nếu ủy ban bỏ phiếu một cách chính xác (so với nhãn sự thật mặt đất) thì nó sẽ giảm cân. Ngược lại để tăng cân. –
Điểm tốt. Đã sửa trong bài đăng. – kitchenette
- 1. Thuật toán AdaBoost ML triển khai python
- 2. Hiểu biết cơ bản về thuật toán Adaboost
- 3. Cây thiết bị là gì? Ưu điểm và nhược điểm?
- 4. Giải thuật cây/Thuật toán đệ quy
- 5. Ưu điểm và nhược điểm (kỹ thuật) của Flash so với AJAX/JS là gì?
- 6. Thuật toán để tìm đối xứng của cây
- 7. Thuật toán chèn cây nhị phân
- 8. Thuật toán phân chia và đồng hóa cho cây
- 9. Ưu điểm và nhược điểm của BPMN?
- 10. Ưu điểm và nhược điểm của NHibernate
- 11. Hiểu thuật toán của Ukkonen cho hậu tố cây
- 12. Ưu điểm của Tesla trên GeForce
- 13. Thuật toán truyền tải cây Javascript
- 14. Thuật toán thị trấn ba tối ưu
- 15. Thuật toán hình ảnh hóa cây
- 16. Ưu điểm và nhược điểm của Java Portlets?
- 17. Ưu điểm của MongoDB trên MySQL và PostgreSQL là gì?
- 18. Những ưu điểm của C# trên Python
- 19. Ưu điểm của [HandleError] trên Application_Error
- 20. Hội tụ điểm ngắt trong thuật toán của Fortune
- 21. Ưu điểm của MySQLi trên MySQL
- 22. Thuật toán cặp điểm gần nhất
- 23. Tối ưu hóa một thuật toán tìm kiếm đơn giản
- 24. Thuật toán cho giao điểm của 2 dòng?
- 25. Thuật toán "unifier chung nhất" tối ưu là gì?
- 26. Thuật toán tạo mê cung tối ưu nhiều người chơi
- 27. Ưu điểm của TypeScript
- 28. Thuật toán của Lucene
- 29. Thuật toán cho điểm gần nhất
- 30. Ưu điểm và ưu điểm của GLib v APR của mỗi
Tại sao thẻ này được gắn thẻ là Java? –
Bạn có bao nhiêu điểm dữ liệu và tính năng? ồn ào, thưa thớt? Tôi khuyên bạn nên bắt đầu với nhanh-tuyến tính SVM [scikit-học SGDClassifier] (http://scikit-learn.org/stable/modules/sgd.html). – denis