Tôi hiện đang thử nghiệm với một nhiệm vụ ML liên quan đến đào tạo được giám sát của một mô hình phân loại. Cho đến nay, tôi đã có ~ 5 triệu ví dụ đào tạo và ~ 5 triệu ví dụ về xác thực chéo. Mỗi ví dụ có, tại thời điểm này, 46 tính năng, tuy nhiên tôi có thể muốn tạo thêm 10 tính năng nữa trong tương lai gần, vì vậy bất kỳ giải pháp nào cũng nên để lại một số chỗ để cải thiện.Nhiệm vụ học máy: công cụ nào để sử dụng?
Vấn đề của tôi là như sau: Tôi sử dụng công cụ nào để giải quyết vấn đề này? Tôi muốn sử dụng các khu rừng ngẫu nhiên hoặc SVM, tuy nhiên tôi sợ rằng điều này có thể quá chậm trong trường hợp của tôi. Tôi đã xem xét Mahout, nhưng quay đi vì nó xuất hiện để yêu cầu một số lượng nhất định của cấu hình cùng với rối tung với các dòng lệnh script. Tôi muốn mã trực tiếp chống lại một số (cũng tài liệu!) Thư viện hoặc xác định mô hình của tôi với một GUI.
Tôi cũng nên chỉ định rằng tôi đang tìm kiếm thứ gì đó sẽ chạy trên Windows (không có thứ như Cygwin) và các giải pháp phù hợp với .NET được đánh giá cao.
Bạn có thể tưởng tượng rằng, khi thời gian sẽ, đến, mã sẽ được chạy trên một Cluster Compute Eight Extra Large Instance trên Amazon EC2, vì vậy bất cứ điều gì mà làm cho sử dụng rộng rãi của RAM và CPU đa lõi được chào đón.
Cuối cùng nhưng không kém, tôi sẽ xác định rằng dữ liệu của tôi là dày đặc (trong đó không có giá trị còn thiếu/tất cả các cột có giá trị cho mỗi vector)
Có vô số công cụ có sẵn (để bắt đầu, hãy xem danh sách phần mềm tại KDnuggets: http://www.kdnuggets.com/software/index.html). Mặc dù mô tả sự cố của bạn loại bỏ một số trong số chúng, vẫn còn một số còn lại có thể đủ. Tôi không chắc chắn, chính xác, bạn có nghĩa là "chơi tốt với .NET", nhưng bất kỳ công cụ đáng giá nào cũng phải cung cấp báo cáo hoặc mã nguồn của mô hình có thể dễ dàng được dịch sang mã .NET. – Predictor
Cảm ơn bạn đã liên kết, hãy kiểm tra ngay khi tôi viết bài này. Đối với chơi tốt với NET nó có nghĩa là một cái gì đó mà có một giao diện lập trình để bắt đầu công việc hoặc thậm chí là một thư viện. NET (hoặc có thể sử dụng wrapper) là thích hợp hơn với cái gì đó không phải là. – em70