Cho một dendrogram y, trong đó có số k cụm dưới giá trị chiều cao z, tôi muốn biết:Lấy số quan sát trong các cụm (k) theo chiều cao (z)
bao nhiêu quan sát được sử dụng để hình thành số cụm (k)?
Dưới đây là một số mã tái sản xuất, và hình ảnh để minh họa cho vấn đề:
#Necessary packages to reproduce the code
library(ggplot2)
library(cluster)
#Example data
x = c(6.2, 2.3, 0, 1.54, 2.17, 6.11, 0.3, 1.39,
5.14, 12.52, 12.57, 7.13, 13.71, 11.42,
8.13, 8.86, 9.97, 10, 8.23, 12.4, 9.51,
20.56, 17.78, 14.91, 19.17, 17.48, 17.44,
21.32,
21.24)
y = c(7.89, 7.63, 5.29, 8.38, 8.37, 10.5, 21.5,
16.65, 23.76, 1.77, 1.8, 10.49, 14.01,
10.36, 10.85, 15.02, 14.91, 14.94, 10.76,
18.58, 23.12, 0, 13.59, 9.68, 17.32, 17.85,
17.79, 4.13, 4.05)
df = data.frame(cbind(x,y))
obs = NROW(df[,1]) #number of data observations
obs
[1] 29
#Clustering
agnes=agnes(df, metric="euclidean", stand=F, method="average")
k_number=sum(agnes$height < 1) #number of clusters under dendrogram's height value of 1
k_number
[1] 7 # k_number resulted in 7 groups/clusters
plot(agnes,which.plots=2)
Các chú thích màu đỏ đã được rút ra bên ngoài R, và họ chỉ ra 7 cụm nhóm theo chiều cao 1.
ggplot(df,aes(x,y)) + xlim(0,22) + ylim(0,25) +
geom_point() +
geom_text(aes(label=row.names(df)),hjust=0.5, vjust=-1.5, cex=5)
Ok, có 7 cụm đến từ 13 o bservations.
Tôi muốn lấy lại số 13.
tôi đã cố gắng đọc rất nhiều tài liệu, nhưng vì tôi không có nhiều quen thuộc với các kỹ thuật R và clustering Tôi đã đấu tranh để tìm thấy điều này . Tks.
tôi đã sử dụng số liệu thống kê ':: cutree'. Gói 'dynamicTreeCut' chưa được cài đặt trên hệ thống của tôi ... – rcs