Tôi chắc chắn đây là một câu hỏi rất cơ bản:Trong R, cách thu gọn danh mục hoặc phân loại các biến?
Trong RI có 600.000 biến phân loại - mỗi trong số đó được phân loại là "0", "1" hoặc "2"
Những gì tôi muốn làm là thu gọn "1" và "2" và để lại "0" của chính nó, sao cho sau khi phân loại lại "0" = "0"; "1" = "1" và "2" = "1" --- cuối cùng tôi chỉ muốn "0" và "1" làm danh mục cho từng biến.
Ngoài ra, nếu có thể tôi không muốn tạo 600.000 biến mới, nếu tôi có thể thay thế các biến hiện tại bằng các giá trị mới sẽ tuyệt vời!
Cách tốt nhất để làm điều này là gì?
Cảm ơn bạn!
Cảm ơn bạn đã trả lời! Đây là cách tôi áp dụng nó vào dữ liệu của tôi một cách cụ thể. Dữ liệu của tôi ở dạng data.frame, mà tôi muốn duy trì: dữ liệu <- read.table ("k.csv", header = TRUE, sep = ",") dta <- data [ , 1: 30] col = dim (dta) [2] cho (y trong 1: col) { py <- factor (pmin (as.data.frame (dta [, y]), 2) , labels = c ("0", "1")) py } Tất nhiên dẫn đến lỗi - Tôi chắc chắn rằng tôi không áp dụng đúng cách – CCA