Có thể nhận các cụm km km giống nhau cho mỗi lần thực hiện cho một tập dữ liệu cụ thể hay không. Cũng giống như cho một giá trị ngẫu nhiên, chúng ta có thể sử dụng một hạt giống cố định. Có thể dừng ngẫu nhiên phân cụm không?k-means: Các cụm giống nhau cho mỗi lần thực hiện
Trả lời
Có, gọi set.seed(foo)
ngay trước khi chạy kmeans(....)
sẽ cung cấp cùng một khởi đầu ngẫu nhiên và do đó cùng một cụm mỗi lần. foo
là một hạt giống, như 42
hoặc một số giá trị số khác.
Có. Sử dụng set.seed
để đặt hạt giống cho giá trị ngẫu nhiên trước khi thực hiện phân cụm.
Sử dụng ví dụ trong kmeans
:
set.seed(1)
x <- rbind(matrix(rnorm(100, sd = 0.3), ncol = 2),
matrix(rnorm(100, mean = 1, sd = 0.3), ncol = 2))
colnames(x) <- c("x", "y")
set.seed(2)
XX <- kmeans(x, 2)
set.seed(2)
YY <- kmeans(x, 2)
Kiểm tra đẳng thức:
identical(XX, YY)
[1] TRUE
+1 cho ví dụ –
Cảm ơn một triệu vì sự trợ giúp tuyệt vời này! Vui lòng chấp nhận OP. – slotishtype
- 1. C# ListView DragDrop Phương thức sự kiện Thực hiện hai lần cho mỗi lần thả
- 2. thực hiện nhiều preg_replace với tìm kiếm khác nhau và thay thế mỗi lần
- 3. Làm cách nào để so sánh các cụm từ cho sự giống nhau?
- 4. Kmeans inter and inter cluster order
- 5. Chỉ sản lượng một lần cho mỗi lần lặp
- 6. Thực hiện Phương pháp Elbow để tìm số cụm tối ưu cho K-Means Clustering trong R
- 7. Hàm trả về MD5 khác nhau mỗi lần
- 8. EXCEPT có thực hiện nhanh hơn JOIN khi các cột trong bảng giống nhau
- 9. đặt hàng điểm clustered sử dụng Kmeans và R
- 10. Phương pháp thiết lập bộ thử nghiệm có được thực hiện một lần cho mỗi thử nghiệm hay chỉ một lần cho tất cả?
- 11. log4net một tệp cho mỗi lần chạy
- 12. MATLAB: Điền ma trận với mỗi cột giống nhau
- 13. Thời gian thực hiện chậm hơn với mỗi lần lặp lại của cùng một SPROC
- 14. Có thể sử dụng các cổng khác nhau cho các nút trong cụm Cassandra không?
- 15. Các cụm hadoop có chạy trên phần cứng giống hệt nhau không?
- 16. Các ứng dụng khác nhau cho mỗi không gian tên
- 17. Phát hiện video gần giống nhau
- 18. Mỗi lần lặp của vòng lặp for_each có được thực hiện song song không? (C++ 11)
- 19. tổng hợp số lần xuất hiện mỗi ngày gấu trúc
- 20. Không thể thực hiện startActivity() với Trình chọn chỉ yêu cầu một lần cho mỗi ứng dụng
- 21. Sử dụng đa xử lý python với các hạt giống ngẫu nhiên khác nhau cho mỗi quá trình
- 22. thực hiện SwingWorker nhiều lần
- 23. Gói Agility Html SelectSingleNode cho kết quả luôn giống nhau trong lần lặp?
- 24. Các số ngẫu nhiên giống nhau lặp lại vòng lặp
- 25. Phân vùng thành các lớp: jenks vs kmeans
- 26. Django-pagination có thể thực hiện nhiều lần truy cập trên mỗi trang không?
- 27. thực hiện: thực hiện một hành động cho mỗi điều kiện tiên quyết
- 28. Làm thế nào để thực hiện một hoạt động hợp nhất Git bỏ qua những thay đổi giống hệt nhau được thực hiện cho cả hai nhánh?
- 29. Eclipse thực thi tìm kiếm nhanh như thế nào cho các lần truy cập đến cụm từ/regexp
- 30. Bao nhiêu dữ liệu cho mỗi nút trong cụm Cassandra?
chỉ cần thêm để đáp ứng Andrie và Gavin, tôi đã thử nghiệm rằng ngay cả khi chúng tôi đặt 'tranh luận nstart' trong các kmeans() lớn hơn 1, tức là có nhiều lần lặp ngẫu nhiên, việc set.seed() sẽ nhận được kết quả giống hệt nhau. –