2015-04-17 17 views
11

Tôi thấy rằng trong scikit-learn tôi có thể xây dựng một trình phân loại SVM với hạt nhân tuyến tính theo 3 cách khác nhau:Trong sklearn sự khác biệt giữa mô hình SVM với hạt nhân tuyến tính và phân loại SGD với loss = bản lề

Bây giờ, tôi thấy rằng đặt cược chênh lệch ween hai phân loại đầu tiên là trước đây được thực hiện dưới dạng liblinear và sau đó là libsvm.

Hai loại phân loại đầu tiên khác với loại thứ ba như thế nào?

Trả lời

11

Hai số đầu tiên luôn sử dụng toàn bộ dữ liệu và giải quyết vấn đề tối ưu hóa lồi liên quan đến các điểm dữ liệu này.

Dữ liệu sau có thể xử lý dữ liệu theo lô và thực hiện một gốc dốc nhằm giảm thiểu tổn thất được mong đợi đối với phân phối mẫu, giả định rằng các ví dụ là mẫu iid của phân phối đó.

Dữ liệu sau thường được sử dụng khi số lượng mẫu rất lớn hoặc không kết thúc. Quan sát bạn có thể gọi hàm partial_fit và nạp dữ liệu cho nó.

Hy vọng điều này sẽ giúp ích?

Các vấn đề liên quan