Tôi đang sử dụng gói randomForest
để phân loại biến kết quả nhị phân với quy trình chuẩn. I 1 had to force a change on all variables to make sure they were numeric and then used na.roughfix
to handle missing values:Lỗi giá trị thiếu trong gói randomForest của R
data <- read.csv("data.csv")
data <- lapply(data, as.numeric)
data <- na.roughfix(data)
Then i run the model:
model <- randomForest(as.factor(outcome) ~ V1 + V2...+ VN,
data=data,
importance=TRUE,
ntree=500)
and I get the following lỗi:
Error in na.fail.default(list(as.factor(outcome) = c(2L, 2L, 1L, : missing values in object
Thông báo bắt buộc phải thực hiện việc này (tôi đã làm việc trước và research on here shows that it should work), phải không? Bất kỳ đề xuất?
cảm ơn phản hồi. Tôi đã thực sự thử giải pháp 'as.data.frame' trước đây. Tôi thử lại nó và cung cấp cho 'dữ liệu [] <- lapply (dữ liệu, as.numeric)' một chạy quá, và cả hai vẫn nhổ lên cùng một lỗi. – bencrosier
@bencrosier Vâng, sau đó nếu bạn muốn trợ giúp cụ thể hơn, bạn sẽ phải cung cấp một ví dụ tái sản xuất. – joran