2011-12-18 20 views
5

Tôi cần trợ giúp về tùy chọn trọng lượng của libSVM. Tôi đang bối rối tại một số điểm; chúng ta cũng nên sử dụng tùy chọn -wi trong khi thực hiện xác nhận chéo? Nếu vậy, chúng ta có nên sử dụng các trọng số được tính toán của toàn bộ dữ liệu hoặc các trọng số được tính theo các tập con v-1 (để xác thực chéo v-fold) không? Và câu hỏi thứ hai của tôi là chúng ta nên sử dụng tùy chọn -wi trong khi dự đoán? Nếu vậy, chúng ta có nên sử dụng các trọng số được tính toán trong quá trình đào tạo hay chúng ta nên tính trọng số theo phân bố các trường hợp âm và dương trong dữ liệu thử nghiệm?LibSVM: tùy chọn -wi (lựa chọn trọng lượng) trong quá trình xác thực chéo và thử nghiệm

Ví dụ; chúng tôi có 50 + dữ liệu và 200 - dữ liệu. Vì vậy, sau khi tính toán các giá trị tham số c và gamma tốt nhất, chúng tôi sẽ sử dụng tùy chọn -w1 4 -w-1 1 trong khi đào tạo. Nhưng những gì về đào tạo trong quá trình tìm kiếm lưới và xác thực chéo? Giả sử chúng tôi đang thực hiện xác thực chéo 5 lần. Trong khi đào tạo trên mỗi 4 tập con còn lại, sự phân bố của các trường hợp tiêu cực và sở hữu có thể sẽ thay đổi. Vậy chúng ta có nên tính toán lại các trọng số trong quá trình xác nhận chéo 5 lần này không?

Ngoài ra, chúng tôi sử dụng tùy chọn -w1 4 -w-1 1 trong khi thử nghiệm?

Cảm ơn

Trả lời

6

Để trả lời câu hỏi đầu tiên của bạn, nếu bạn đang áp dụng trọng lượng không tầm thường để một tập hợp con của các lớp học trong đào tạo mô hình, thì bạn nên làm như vậy suốt đào tạo của bạn/chỉnh bao gồm cross-validation dựa chỉnh của C và gamma (nếu không bạn sẽ điều chỉnh mô hình dựa trên chức năng mục tiêu/rủi ro/mất chi phí nhạy cảm khác với chức năng bạn chỉ định bằng cách bật trọng số lớp không tầm thường)

Trọng số của lớp là bên ngoài với libSVM theo nghĩa là chúng không được tính toán bởi libSVM - tùy chọn dòng lệnh đó cho phép người dùng thiết lập trọng số lớp của riêng mình để nhấn mạnh/giảm tầm quan trọng của một tập con của các lớp. Một số người điều chỉnh trọng lượng lớp học nhưng đó là một câu chuyện khác. Đối với dự đoán, trọng số của lớp không được sử dụng rõ ràng (vì chúng đi vào như một "tinh chỉnh" cho chức năng mục tiêu/rủi ro/mất mát trong giai đoạn huấn luyện/điều chỉnh mô hình để mô hình kết quả đã "nhận biết "của trọng số)

Các vấn đề liên quan