Trong sklearn sự khác biệt giữa mô hình SVM với hạt nhân tuyến tính và phân loại SGD với loss = bản lề

Tôi thấy rằng trong scikit-learn tôi có thể xây dựng một trình phân loại SVM với hạt nhân tuyến tính theo 3 cách khác nhau:Trong sklearn sự khác biệt giữa mô hình SVM với hạt nhân tuyến tính và phân loại SGD với loss = bản lề

LinearSVC
SVC với kernel = 'thẳng' tham số
Stochastic Gradient Descent với sự mất mát = 'bản lề' tham số

Bây giờ, tôi thấy rằng đặt cược chênh lệch ween hai phân loại đầu tiên là trước đây được thực hiện dưới dạng liblinear và sau đó là libsvm.

Hai loại phân loại đầu tiên khác với loại thứ ba như thế nào?

Nguồn

2015-04-17 JackNova

Hai số đầu tiên luôn sử dụng toàn bộ dữ liệu và giải quyết vấn đề tối ưu hóa lồi liên quan đến các điểm dữ liệu này.

Dữ liệu sau có thể xử lý dữ liệu theo lô và thực hiện một gốc dốc nhằm giảm thiểu tổn thất được mong đợi đối với phân phối mẫu, giả định rằng các ví dụ là mẫu iid của phân phối đó.

Dữ liệu sau thường được sử dụng khi số lượng mẫu rất lớn hoặc không kết thúc. Quan sát bạn có thể gọi hàm partial_fit và nạp dữ liệu cho nó.

Hy vọng điều này sẽ giúp ích?

Nguồn

2015-04-17 17:58:32 eickenberg

Trong sklearn sự khác biệt giữa mô hình SVM với hạt nhân tuyến tính và phân loại SGD với loss = bản lề

Trả lời

Các vấn đề liên quan