2010-07-02 38 views
40

Weka có lẽ là thư viện học tập chung cho máy đa mục đích phổ biến nhất. Nhưng nó có thể khá chậm trong kinh nghiệm của tôi.Thư viện học máy chung nhanh nhất?

Tôi đã xem xét Shark, Waffles, dlib, PlearnMLC++ làm phương án thay thế. Trong số này, Shark và dlib trông đầy hứa hẹn nhất.

Có ai có kinh nghiệm nào khi nói đến kiểm tra hiệu suất của các thư viện này không?

+0

bạn cũng có thể quan tâm http://code.google.com/p/eureqa-api/ phương trình hiệu suất cao tìm kiếm – Inverse

+0

Phụ thuộc hoàn toàn vào * loại * loại mô hình bạn muốn tìm hiểu. CRF? SVM? HMM? – bmargulies

+4

Weka là ** cực kỳ chậm **. –

Trả lời

39

Đối với tôi, điều quan trọng nhất sẽ là "Bộ công cụ này có thuật toán hoặc tính năng tôi muốn thử không?" Vì các bộ công cụ này cung cấp một bộ tính năng khá đa dạng, trước tiên bạn nên cố gắng thu hẹp những gì bạn muốn làm.

Vì vậy, ví dụ, nếu bạn có một mong muốn cháy để thử các thuật toán tối ưu hóa tiến hóa khác nhau thì tôi sẽ đi với một cái gì đó như Shark.

Mặt khác, tôi thích dlib cho hầu hết công việc của tôi, nhưng điều đó không nhất thiết có nghĩa là rất nhiều, kể từ khi tôi viết nó :) Tuy nhiên, nếu bạn quan tâm đến phân loại nhị phân thì hãy để tôi đề xuất yêu thích hiện tại của tôi phương pháp cho rằng, svm_c_ekm_trainer. Tôi thường sử dụng điều này để huấn luyện SVM phi tuyến tính trên các tập dữ liệu của hàng trăm nghìn điểm. Nó thường chạy trong vài phút (hoặc đôi khi thậm chí là vài giây) trong khi thuật toán SMO cổ điển cho việc này sẽ mất hàng giờ hoặc vài ngày để hoàn thành.

Cũng có một số câu trả lời hay cho một câu hỏi tương tự được hỏi cách đây không lâu: Which machine learning library to use.

+1

Cảm ơn Davis! Công việc tuyệt vời với dlib! Tôi thực sự chỉ tìm kiếm thứ gì đó có rất nhiều chức năng để tôi có thể sử dụng hầu hết thời gian, nhưng sẽ phân nhánh thành những thứ khác khi cần thiết. – griffin

Các vấn đề liên quan