Tôi muốn sử dụng Attribute-Relation File Format với tính năng tìm hiểu để thực hiện một số nhiệm vụ NLP, điều này có khả thi không? Làm cách nào để sử dụng tệp .arff
với scikit-learn
?. Các tệp .arff có scikit-learn?
Trả lời
Tôi thực sự khuyên bạn nên liac-arff. Nó không tải trực tiếp đến NumPy, nhưng việc chuyển đổi rất đơn giản: câu trả lời
import arff, numpy as np
dataset = arff.load(open('mydataset.arff', 'rb'))
data = np.array(dataset['data'])
Tôi thấy rằng scipy has a loader for arff files để tải chúng dưới dạng mảng bản ghi có khối lượng. Tôi không chắc chắn 100% rằng những mảng đó phù hợp để tiêu thụ trực tiếp bằng cách tìm hiểu nhưng điều đó sẽ giúp bạn bắt đầu.
Bạn có nghĩ rằng tôi sẽ cần phải phân tích cú pháp các mảng numpy? ... Những loại tiền xử lý tôi sẽ cần phải làm để nuôi một số thuật toán phân loại trong scikit-tìm hiểu? – tumbleweed
Thực hiện theo renatopp của: giả dữ liệu của bạn là tập dữ liệu iris, cần có 5 chiều với người cuối cùng là cột nhãn lớp.
s = svm.SVC()
data_input = data[:,0:4]
labels = data[:,4] # this is the class column
s.fit(data_input, labels)
Tôi nghĩ đây là điều bạn muốn.
- 1. cách tải tệp định dạng .arff vào MATLAB
- 2. Scikitlearn thực hiện tìm kiếm dòng như thế nào?
- 3. ARFF để xử lý ngôn ngữ tự nhiên
- 4. Chuyển đổi Weka CSV sang Arff: IllegalArgumentException: Tên thuộc tính không phải là duy nhất
- 5. Tại sao scikitlearn cho biết điểm số F1 không được xác định với FN lớn hơn 0?
- 6. lệnh để biên dịch các tệp c có tệp .a
- 7. Cập nhật các tệp bên trong tệp WAR hiện có
- 8. Đổi tên các tệp CarrierWave hiện có
- 9. GCC có hỗ trợ các tệp lệnh
- 10. Các tệp PDB có cài đặt cmake
- 11. Các tệp Jspx và các nhận xét có điều kiện
- 12. Tạo các tệp MP4/M4A có các dấu chương Chương
- 13. Các tệp Python 2.5 .pyc có tương thích với các tệp Python 2.6 .pyc không?
- 14. Hợp nhất các tệp dịch (.ts) với các tệp .ts hiện có bằng QT Utilities (lconvert)
- 15. Các tệp .lib có vô dụng nếu không có tệp tiêu đề không?
- 16. Có thể tách các tệp maven pom không?
- 17. Tự động và các tệp có cùng tên
- 18. Đọc các tệp văn bản lớn có dòng trong C#
- 19. XAML không có mã .xaml.cs phía sau các tệp
- 20. Có thể sắp xếp các tệp trên Amazon S3 không?
- 21. Tôi có thể hợp nhất các tệp trong git không?
- 22. Có thể xem các tệp lớp Java bytecode
- 23. MSBuild: Triển khai các tệp không có trong dự án
- 24. Xóa các tệp có ký tự đại diện trong Laravel
- 25. Gắn thẻ các tệp mkv có ảnh bìa?
- 26. Qt có tự động đóng các tệp không?
- 27. Có bộ thử nghiệm cho các tệp PDF không?
- 28. Có thư viện Python để tạo các tệp .ico không?
- 29. Git có tốt với các tệp nhị phân không?
- 30. Các tệp Javascript có nên bao gồm BOM hay không?
Cảm ơn bạn đã phản hồi. Bất kỳ ý tưởng nào về cách tôi có thể sử dụng cuộc trò chuyện này để phân loại ?. – tumbleweed
tôi tất cả đã sẵn sàng biết rằng ví dụ với SVM ý tưởng cơ bản để phân loại là: 'từ sklearn nhập khẩu svm s = svm.SVC() lables = [label1, LABEL2] s.fit (training_data, nhãn)' Làm thế nào có thể tôi trình bày một tập tin 'arff' vào một thuật toán phân loại? – tumbleweed
Bạn có thể phân tích cú pháp điểm TF-IDF từ tệp .arff và sử dụng nó trong sklearn không? –