Tôi đã sử dụng RandomForest cho một vấn đề hồi quy. Tôi đã sử dụng importance(rf,type=1)
để nhận% IncMSE cho các biến và một trong số chúng có% IncMSE âm. Điều này có nghĩa là biến này có hại cho mô hình không? Tôi đã tìm kiếm trên Internet để nhận được một số câu trả lời nhưng tôi không tìm thấy câu trả lời rõ ràng. Tôi cũng tìm thấy một cái gì đó kỳ lạ trong bản tóm tắt của mô hình (đính kèm dưới đây), Có vẻ như rằng chỉ có một cây được sử dụng mặc dù tôi định nghĩa ntrees
như 800.Giá trị âm% IncMSE trong gói RandomForest có nghĩa là gì?
mô hình:
rf<-randomForest(var1~va2+var3+..+var35,data=d7depo,ntree=800,keep.forest=FALSE, importance=TRUE)
summary(rf)
Length Class Mode
call 6 -none- call
type 1 -none- character
predicted 26917 -none- numeric
mse 800 -none- numeric
rsq 800 -none- numeric
oob.times 26917 -none- numeric
importance 70 -none- numeric
importanceSD 35 -none- numeric
localImportance 0 -none- NULL
proximity 0 -none- NULL
ntree 1 -none- numeric
mtry 1 -none- numeric
forest 0 -none- NULL
coefs 0 -none- NULL
y 26917 -none- numeric
test 0 -none- NULL
inbag 0 -none- NULL
terms 3 terms call
Cảm ơn bạn rất nhiều LyzandeR cho câu trả lời chi tiết và rõ ràng của bạn, Chúc mừng, Ron – mql4beginner
Chúc mừng đã giúp Ron :). Nếu bạn muốn đào sâu hơn, bạn có thể xem [tại đây] (http://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm). Đây là từ chính Breiman (nhà phát minh ra những khu rừng ngẫu nhiên) và ông giải thích chính xác cách họ làm việc bằng tiếng Anh đơn giản mà không có (rất nhiều) công thức toán học. Đây chính là tham chiếu gói rf được sử dụng để thực hiện. – LyzandeR
Cảm ơn, tôi sẽ kiểm tra nó ra .. – mql4beginner