Tôi vẫn còn tương đối mới đối với R, vì vậy xin lỗi trước nếu câu hỏi của tôi có vẻ quá cơ bản.Cách tìm các giá trị thường xuyên nhất trên một số cột có chứa các yếu tố
Sự cố của tôi như sau:
Tôi có tập dữ liệu chứa nhiều biến yếu tố có cùng danh mục. Tôi cần phải tìm loại, xảy ra thường xuyên nhất cho mỗi quan sát trên các biến yếu tố. Trong trường hợp quan hệ một giá trị tùy ý có thể được chọn, mặc dù nó sẽ là tuyệt vời nếu tôi có thể kiểm soát nhiều hơn nó.
Tập dữ liệu của tôi chứa hơn một trăm yếu tố. Tuy nhiên, cấu trúc giống như vậy:
id <- 1:3
var1 <- c("red","yellow","green")
var2 <- c("red","yellow","green")
var3 <- c("yellow","orange","green")
var4 <- c("orange","green","yellow")
df <- data.frame(cbind(id, var1, var2, var3, var4))
> df
id var1 var2 var3 var4
1 1 red red yellow orange
2 2 yellow yellow orange green
3 3 green green green yellow
Giải pháp phải là biến trong khung dữ liệu, ví dụ var5, chứa danh mục thường xuyên nhất cho mỗi hàng. Nó có thể là một yếu tố hoặc một vector số (trong trường hợp các dữ liệu cần phải được chuyển đổi đầu tiên vectơ số)
Trong trường hợp này, tôi muốn có giải pháp này:
> df$var5
[1] "red" "yellow" "green"
Bất cứ lời khuyên sẽ Nhiều đánh giá cao! Cảm ơn trước!
công việc tốt đẹp, sạch hơn tôi. Đã không nhận ra rằng tôi có thể bỏ qua tất cả các chuyển đổi, không công bố, v.v. –
Cảm ơn bạn rất nhiều vì giải pháp này. Tôi chỉ thử nó trên dữ liệu của riêng tôi và nó hoạt động hoàn hảo! Bạn có thể, xin vui lòng, chỉ cần làm rõ cho tôi, làm thế nào để phương pháp này giải quyết quan hệ? Cảm ơn! – ZMacarozzi
Tôi đã chỉnh sửa câu trả lời của mình để minh họa trường hợp bằng cà vạt. Đó là thói quen tốt để tìm hiểu cách sử dụng các trang trợ giúp. Tôi vui vì giải pháp của tôi đã làm việc cho bạn. – Chargaff