Ai đó có thể giải thích cách cột Cover
trong gói xgboost
R được tính theo hàm xgb.model.dt.tree
?Bảng tính xgboost được tính như thế nào?
Trong tài liệu, nó nói rằng Bìa "là số liệu để đo số quan sát bị ảnh hưởng bởi việc chia tách".
Khi bạn chạy mã sau, được đưa ra trong tài liệu xgboost
cho hàm này, Cover
cho nút 0 của cây 0 là 1628.2500.
data(agaricus.train, package='xgboost')
#Both dataset are list with two items, a sparse matrix and labels
#(labels = outcome column which will be learned).
#Each column of the sparse Matrix is a feature in one hot encoding format.
train <- agaricus.train
bst <- xgboost(data = train$data, label = train$label, max.depth = 2,
eta = 1, nthread = 2, nround = 2,objective = "binary:logistic")
#[email protected][[2]] represents the column names of the sparse matrix.
xgb.model.dt.tree([email protected][[2]], model = bst)
Có 6513 quan sát trong tập dữ liệu đào tạo, vì vậy bất cứ ai có thể giải thích tại sao Cover
cho nút 0 cây 0 là một phần tư số này (1628,25)?
Ngoài ra, Cover
cho nút 1 của cây 1 là 788.852 - số này được tính như thế nào?
Mọi trợ giúp sẽ được đánh giá cao. Cảm ơn.
Giải thích tuyệt vời. Cảm ơn bạn – dataShrimp
Ngoài ra, tôi không cho rằng bạn có thể làm sáng tỏ một số câu hỏi này? http://stackoverflow.com/questions/33654479/how-is-xgboost-quality-calculated – dataShrimp
@dtfoster Tôi đã chơi xung quanh với câu hỏi khác - chưa bẻ khóa được ... Có một số trọng số nhỏ sẽ trên mui xe có một số khác biệt nhỏ từ trang trình bày của anh ấy –