Tôi có bộ dữ liệu với thông tin như tuổi, thành phố, tuổi của trẻ em ... và kết quả (xác nhận, chấp nhận). Để giúp mô hình hóa "quy trình làm việc", tôi muốn tạo tự động cây quyết định dựa trên các tậ
Tôi đang xây dựng một cây phân loại nhị phân bằng cách sử dụng mutual information gain làm hàm tách. Nhưng vì dữ liệu huấn luyện bị lệch về một vài lớp, nên cân nhắc mỗi ví dụ đào tạo theo tần suất lớ