Tôi đã đào tạo một ExtraTreesClassifier (chỉ mục gini) bằng cách sử dụng scikit-learn và nó phù hợp với nhu cầu của tôi một cách công bằng. Độ chính xác không tốt lắm, nhưng sử dụng xác nhận chéo 10 lần, AUC là 0,95. Tôi muốn sử dụng phân loại này trên công việc của mình. Tôi khá mới với ML, vì vậy hãy tha thứ cho tôi nếu tôi hỏi bạn điều gì đó sai về mặt khái niệm.Làm cách nào để đặt ngưỡng cho trình phân loại sklearn dựa trên kết quả ROC?
Tôi vẽ một số đường cong ROC, và theo nó, dường như tôi có một ngưỡng cụ thể nơi trình phân loại của tôi bắt đầu hoạt động tốt. Tôi muốn thiết lập giá trị này trên phân loại được trang bị, vì vậy mọi khi tôi muốn gọi dự đoán, các phân loại sử dụng ngưỡng đó và tôi có thể tin vào tỷ lệ FP và TP.
Tôi cũng đã truy cập vào bài đăng này (scikit .predict() default threshold), trong đó tuyên bố rằng ngưỡng không phải là khái niệm chung cho các trình phân loại. Nhưng kể từ khi ExtraTreesClassifier có phương thức predict_bị_bị, và đường cong ROC cũng liên quan đến định nghĩa thresdholds, có vẻ như tôi nên có sẵn để xác định nó.
Tôi không tìm thấy bất kỳ tham số nào cũng như bất kỳ lớp/giao diện nào để sử dụng để thực hiện. Làm thế nào tôi có thể thiết lập một ngưỡng cho nó cho một ExtraTreesClassifier được đào tạo (hoặc bất kỳ một khác) bằng cách sử dụng scikit-tìm hiểu?
Nhiều Cảm ơn, Colis
Hi trắng, nhờ trả lời của bạn. Tôi đã tối ưu hóa nó bằng cách chọn roc_auc và các số liệu khác mà tôi quan tâm vào thời điểm đó (tôi cũng đã tạo một trình chỉnh sửa tùy chỉnh để tối ưu hóa LR +). Nghi ngờ chính của tôi là làm thế nào để chọn một trong các ngưỡng hiển thị bởi một điểm trên đường cong ROC như ngưỡng cho khi tôi gọi dự đoán()? Câu hỏi của tôi liên quan đến (). Tôi không chắc chắn rằng điều này sẽ có sẵn cho cây, vì họ thường không sử dụng khí thăm dò. Nhưng làm thế nào để thiết lập nó cho các phương pháp khác, sau đó? –
Colis