5

enter image description hereGiá trị của 'lá' trong sơ đồ cây mô hình xgboost sau đây có nghĩa là gì?

Tôi đoán rằng đó là xác suất có điều kiện cho rằng điều kiện ở trên (nhánh cây) tồn tại. Tuy nhiên, tôi không rõ ràng về nó.

Nếu bạn muốn tìm hiểu thêm về các dữ liệu được sử dụng hoặc làm thế nào để chúng ta có được sơ đồ này sau đó đi đến: http://machinelearningmastery.com/visualize-gradient-boosting-decision-trees-xgboost-python/

+0

tôi có thấy một số giá trị âm trong một số lá không? – dksahuji

Trả lời

0

Thuộc tính leaf là giá trị dự đoán. Nói cách khác, nếu việc đánh giá một mô hình cây kết thúc tại nút đầu cuối đó (còn gọi là nút lá), thì đây là giá trị được trả về.

Trong giả (trái nhất chi nhánh của mô hình cây của bạn):

if(f1 < 127.5){ 
    if(f7 < 28.5){ 
    if(f5 < 45.4){ 
     return 0.167528f; 
    } else { 
     return 0.05f; 
    } 
    } 
} 
1

Bạn là chính xác. Những giá trị xác suất liên kết với các nút lá đại diện cho xác suất có điều kiện của đạt các nút lá cho một nhánh cụ thể của cây. Chi nhánh của cây có thể được trình bày như một bộ quy tắc. Ví dụ: @ user1808924 được đề cập trong số answer; một quy tắc đại diện cho nhánh bên trái nhất của mô hình cây của bạn. Vì vậy, trong ngắn hạn: Cây có thể được tuyến tính thành các quy tắc quyết định, trong đó kết quả là nội dung của nút lá và các điều kiện dọc theo đường dẫn tạo thành một kết hợp trong mệnh đề if. Nói chung, các quy tắc có dạng:

if condition1 and condition2 and condition3 then outcome. 

Quy tắc quyết định có thể được tạo bằng cách xây dựng quy tắc kết hợp với biến mục tiêu ở bên phải. Chúng cũng có thể biểu thị quan hệ temporal hoặc causal.

Các vấn đề liên quan