tôi biết công thức để tính entropy:Tính entropy trong cây quyết định (Machine learning)
H(Y) = - ∑ (p(yj) * log2(p(yj)))
Nói cách, chọn một thuộc tính và cho từng mục tiêu kiểm tra giá trị giá trị thuộc tính ... nên p (yj) là phần nhỏ của các mẫu ở Node N nằm trong danh mục yj - một cho giá trị đích và một cho sai.
Nhưng tôi có tập dữ liệu trong đó thuộc tính đích là giá, do đó có phạm vi. Làm thế nào để tính toán entropy cho tập dữ liệu kinda này?
(Người giới thiệu: http://decisiontrees.net/decision-trees-tutorial/tutorial-5-exercise-2/)
nhưng làm cách nào tôi có thể quyết định phạm vi? giả sử tôi đã sắp xếp dữ liệu, làm thế nào để quyết định phạm vi ... chỉ cần đoán, nếu tôi muốn nhị phân sau đó avg của dữ liệu này? –
Có nhiều phương pháp được sử dụng cho điều này, tôi sẽ thêm nhiều thông tin hơn vào câu trả lời, cho tôi một giây ... –
oops này không có ý nghĩa .. nếu thuộc tính có hai giá trị thì nhị phân ... cảm ơn @Vic Smith! –