Trong r gói R, điều gì xác định kích thước của cây được trình bày trong bảng CP cho cây quyết định? Trong ví dụ dưới đây, bảng CP mặc định chỉ trình bày các cây có các nút 1, 2 và 5 (tương ứng là nsplit = 0, 1 và 4).Kích cỡ cây được đưa ra bởi bảng CP trong rpart
library(rpart)
fit <- rpart(Kyphosis ~ Age + Number + Start, method="class", data=kyphosis)
> printcp(fit)
Classification tree:
rpart(formula = Kyphosis ~ Age + Number + Start, data = kyphosis,
method = "class")
Variables actually used in tree construction:
[1] Age Start
Root node error: 17/81 = 0.20988
n= 81
CP nsplit rel error xerror xstd
1 0.176471 0 1.00000 1.00000 0.21559
2 0.019608 1 0.82353 0.94118 0.21078
3 0.010000 4 0.76471 0.94118 0.21078
Có quy tắc vốn có rpart()
được sử dụng để xác định kích thước cây để trình bày không? Và có thể ép buộc printcp()
trả lại thống kê xác thực chéo cho tất cả các kích thước cây có thể, ví dụ như ví dụ trên, cũng bao gồm các hàng cho các cây có 3 và 4 nút (nsplit = 2, 3) không?
Cảm ơn câu trả lời của bạn, nhưng tôi đã có ấn tượng rằng 'minsplit' và' cp' là các thông số được sử dụng để trồng cây trước khi xác thực chéo được cố gắng - chứ không phải cắt tỉa nó sau đó. câu hỏi và bảng CP đề cập đến. Nếu tôi đã hiểu lầm, bạn có thể tư vấn tại sao đầu ra ở trên chỉ trình bày nsplit = 0, 1, 4 và những giá trị thích hợp nào của 'minsplit' và' cp' có thể là nsplit = 0, 1, 2, 3, 4? Ngẫu nhiên, 'tóm tắt (phù hợp)' không cho tôi số liệu thống kê chéo xác nhận cho tất cả các giá trị của nsplit - bảng CP mà nó cho thấy giống như câu hỏi. – alopex