Khi sử dụng XGBoost
, chúng ta cần chuyển đổi các biến phân loại thành số.Biến thể loại XGBoost: Dummification vs encoding
Nên có bất kỳ sự khác biệt trong số liệu hiệu suất/đánh giá giữa các phương pháp:
- dummifying biến phân loại của bạn
- mã hóa biến phân loại của bạn từ ví dụ (A, b, c) (1,2,3)
CŨNG:
Nên có bất kỳ lý do để không đi với phương pháp 2 bằng cách sử dụng ví dụ labelencoder
?
Sẽ không này làm cho tính năng với nhiều danh mục xuất hiện quan trọng hơn những người có ít? – eleanora
Cách 'Xgboost' biết xử lý' mảng ([1., 0., ...]) 'như phân loại thay vì số? –
@ThiagoBalbo Đơn giản chỉ cần đặt: nó không. Bạn chỉ cần thay thế biến/tính năng/cột ban đầu bằng 3 biến nhị phân/tính năng/cột. – masu