Các trang trợ giúp cho randomforest::randomforest()
nói:Tham số 'classwt' trong hàm RandomForest trong gói RandomForest trong R là gì?
"classwt - Priors của các lớp không cần phải thêm lên đến một Ignored cho hồi quy.."
Có thể đặt tham số classwt
giúp khi bạn có dữ liệu không cân bằng nặng, tức là. các chuyên gia lớp học khác nhau mạnh mẽ?
Làm cách nào để đặt classwt
khi đào tạo mô hình trên tập dữ liệu với 3 lớp với vectơ của các chuyên gia bằng (p1, p2, p3) và trong các chuyên gia thiết lập thử nghiệm là (q1, q2, q3)?
Tôi không chắc chắn về câu hỏi thứ hai của bạn, nhưng 'classwt' tôi tin được sử dụng khi lấy mẫu từ dữ liệu của bạn, sao cho mỗi mẫu cho mỗi cây được vẽ từ các lớp của bạn với xác suất đó (sau khi chuẩn hóa). – joran
strata mang lại hiệu suất giống như classwt và dễ kiểm soát hơn, hãy xem hướng dẫn này trên SO: http://stats.stackexchange.com/questions/157714/r-package-for-weighted-random-forest-classwt-option/158030 # 158030 –
@joran đó là chiến thuật mà bạn đang mô tả. Classwt được sử dụng để cân mẫu khi tìm điểm ngắt tối ưu để tách nút và xác định dự đoán nút trong khi đào tạo. –