Đối với tôi, điều quan trọng nhất sẽ là "Bộ công cụ này có thuật toán hoặc tính năng tôi muốn thử không?" Vì các bộ công cụ này cung cấp một bộ tính năng khá đa dạng, trước tiên bạn nên cố gắng thu hẹp những gì bạn muốn làm.
Vì vậy, ví dụ, nếu bạn có một mong muốn cháy để thử các thuật toán tối ưu hóa tiến hóa khác nhau thì tôi sẽ đi với một cái gì đó như Shark.
Mặt khác, tôi thích dlib cho hầu hết công việc của tôi, nhưng điều đó không nhất thiết có nghĩa là rất nhiều, kể từ khi tôi viết nó :) Tuy nhiên, nếu bạn quan tâm đến phân loại nhị phân thì hãy để tôi đề xuất yêu thích hiện tại của tôi phương pháp cho rằng, svm_c_ekm_trainer. Tôi thường sử dụng điều này để huấn luyện SVM phi tuyến tính trên các tập dữ liệu của hàng trăm nghìn điểm. Nó thường chạy trong vài phút (hoặc đôi khi thậm chí là vài giây) trong khi thuật toán SMO cổ điển cho việc này sẽ mất hàng giờ hoặc vài ngày để hoàn thành.
Cũng có một số câu trả lời hay cho một câu hỏi tương tự được hỏi cách đây không lâu: Which machine learning library to use.
Nguồn
2010-07-02 21:20:53
bạn cũng có thể quan tâm http://code.google.com/p/eureqa-api/ phương trình hiệu suất cao tìm kiếm – Inverse
Phụ thuộc hoàn toàn vào * loại * loại mô hình bạn muốn tìm hiểu. CRF? SVM? HMM? – bmargulies
Weka là ** cực kỳ chậm **. –