Tôi đã quan sát thấy rằng các giá trị âm trở lại không thường xuyên của clf.tree_.feature scikit-learn. Ví dụ -2. Theo như tôi hiểu clf.tree_.feature là nghĩa vụ phải trả lại thứ tự tuần tự của các tính năng. Trong trường hợp chúng tôi có mảng tên đối tượng địa lý ['feature_one', 'feature_two', 'feature_three']
, thì -2 sẽ tham chiếu đến feature_two
. Tôi ngạc nhiên với việc sử dụng chỉ số tiêu cực. Trong sẽ có ý nghĩa hơn để tham khảo feature_two
bởi chỉ số 1. (-2 là tham khảo thuận tiện cho tiêu hóa của con người, không phải để xử lý máy). Tôi có đọc nó đúng không?clf.tree_.feature - đầu ra là gì? (scikit-learn)
Cập nhật: Dưới đây là một ví dụ:
def leaf_ordering():
X = np.genfromtxt('X.csv', delimiter=',')
Y = np.genfromtxt('Y.csv',delimiter=',')
dt = DecisionTreeClassifier(min_samples_leaf=10, random_state=99)
dt.fit(X, Y)
print(dt.tree_.feature)
Dưới đây là các tập tin X và Y
Đây là kết quả:
[ 8 9 -2 -2 9 4 -2 9 8 -2 -2 0 0 9 9 8 -2 -2 9 -2 -2 6 -2 -2 -2
2 -2 9 8 6 9 -2 -2 -2 8 9 -2 9 6 -2 -2 -2 6 -2 -2 9 -2 6 -2 -2
2 -2 -2]
Bạn có thể đưa ra ví dụ không? – tfv
@tfv, tôi vừa đăng một ví dụ. – user1700890