Tôi tự hỏi những gì người khác đang làm với K-means cluster order. Tôi đang tạo bản đồ nhiệt (chủ yếu là số liệu ChIP-Seq) và nhận được các số liệu đẹp mắt với chức năng heatmap tùy chỉnh (dựa trên chức năng bản đồ nhiệt tích hợp của R). Tuy nhiên, tôi muốn có hai cải tiến. Thứ nhất là sắp xếp các cụm của tôi dựa trên giá trị trung bình giảm. Ví dụ: mã sau:Kmeans inter and inter cluster order
fit = kmeans(data, 8, iter.max=50, nstart=10)
d = data.frame(data, symbol)
d = data.frame(d, fit$cluster)
d = d[order(d$fit.cluster),]
cho tôi một data.frame đặt hàng trên cột cụm. Cách tốt nhất để đặt hàng các hàng như vậy mà 8 cụm là theo thứ tự của phương tiện tương ứng của họ là gì?
Thứ hai, bạn có đề xuất sắp xếp các hàng WITHIN mỗi cụm từ giá trị trung bình cao nhất đến thấp nhất không? Điều này sẽ áp đặt một cái nhìn có tổ chức hơn vào dữ liệu, nhưng có thể đánh lừa một người quan sát không thận trọng để suy ra một cái gì đó mà ông có lẽ không nên. Nếu bạn đề nghị điều này, làm thế nào bạn sẽ làm điều đó một cách hiệu quả nhất?
phương tiện gì? Một trong các biến được sử dụng để phân cụm hoặc một biến khác? –
Phương tiện của các giá trị trong mỗi cụm. Ví dụ, nếu mỗi cluster là 30 hàng trong một data.frame và data.frame có 10 cột mà trên đó k-means clustering được thực hiện, tôi muốn giá trị trung bình của 300 giá trị trong mỗi cluster. Cũng có thể sử dụng centroid. –
Trọng tâm không phải là một số cho mỗi cụm, nó là một điểm trong không gian 10-d và do đó mỗi trung tâm cụm có 10 tọa độ. –