Câu hỏi của tôi liên quan đến this one liên quan đến dữ liệu phân loại (các yếu tố trong thuật ngữ R) khi sử dụng gói Caret. Tôi hiểu từ bài đăng được liên kết rằng nếu bạn sử dụng "giao diện công thức", một số tính năng có thể là các yếu tố và việc đào tạo sẽ hoạt động tốt. Câu hỏi của tôi là làm thế nào tôi có thể mở rộng dữ liệu với hàm preProcess()
? Nếu tôi cố gắng và làm điều đó trên một khung dữ liệu với một số cột như các yếu tố, tôi nhận được thông báo lỗi này:Cách xử lý trước các tính năng khi một số trong số đó là các yếu tố?
Error in preProcess.default(etitanic, method = c("center", "scale")) :
all columns of x must be numeric
Xem ở đây một số mẫu mã:
library(earth)
data(etitanic)
a <- preProcess(etitanic, method=c("center", "scale"))
b <- predict(etitanic, a)
Cảm ơn bạn.
Tôi nghĩ chúng ta chỉ cần hai biến cho lớp con. (hoặc là "pclass1st, pclass2nd" hoặc "pclass2nd, pclass3rd" hoặc "pclass3rd, pclass1st"). Giống như trong trường hợp quan hệ tình dục biến đổi, chúng tôi đã xem xét chỉ sexmale và bỏ sexfemale. Đúng nếu tôi không đủ. – Sandeep
@topepo, tôi nghĩ câu trả lời dưới đây không bỏ qua danh sách việc cần làm. Tôi sẽ đề nghị thêm một số cảnh báo cho những người không chú ý. –