Tôi có một thuật toán đang chạy trên một tập các đối tượng. Thuật toán này tạo ra một giá trị điểm số quy định sự khác biệt giữa các phần tử trong tập hợp.Giá trị Clustering bởi sự gần nhau của chúng trong python (máy học?)
Kết quả được sắp xếp là một cái gì đó như thế này:
[1,1,5,6,1,5,10,22,23,23,50,51,51,52,100,112,130,500,512,600,12000,12230]
Nếu bạn đặt các giá trị này xuống trên bảng tính, bạn sẽ thấy chúng tạo thành nhóm
[1,1,5,6,1,5] [10,22,23,23] [50,51, 51,52] [100,112,130] [500,512,600] [12000,12230]
Có cách nào để lập trình các nhóm này không?
Có thể một số thuật toán phân cụm bằng thư viện học máy? Hay tôi đang suy nghĩ về điều này?
Tôi đã xem xét scikit nhưng các ví dụ của chúng quá cao cấp cho sự cố của tôi ...
một chức năng kmeans2 cập nhật (trong scipy.cluster.vq) bây giờ kết quả đầu ra cả hai trọng tâm và nhãn, ví dụ 'kclust, label = kmeans (m, 5)' – Sean
Xin chào, Mã không hoạt động. Lỗi trong dòng đầu tiên vì lý do rõ ràng. Dòng cuối cùng cũng tạo ra một lỗi, 'cluster_indices' không được định nghĩa. Bạn có thể vui lòng giúp mã này chạy không? – gprakhar
@gprakhar Sử dụng 'cluster_indices = kclust [0] [:, 0]'. – joost