Làm cách nào để sử dụng gói R randomForest
với trọng số quan sát? Tôi biết rằng không có tùy chọn như vậy trong gói này. Tôi có 2 câu hỏi:Kết hợp các trọng số quan sát trong gói randomForest
Có giải pháp nào cho vấn đề này khi sử dụng gói
randomForest
không? Tại thời điểm này tôi đang lấy mẫu từ dữ liệu có trọng số là xác suất để tôi ít nhất có thể mô phỏng nó:m = dim(data)[1] sample(data, m, replace=TRUE, prob=weights)
Nó hoạt động có giải pháp nào khác (tốt hơn)?
Có bất kỳ lựa chọn thay thế nào cho gói
randomForest
. Tôi tìm thấy góiparty
(cforest) nhưng nó rất khủng khiếp về mặt quản lý bộ nhớ (hoặc tôi không thể sử dụng nó theo cách tôi sử dụng góirandomForest
). Tôi có khoảng 200k quan sát và 30-40 biến.
EDIT:
Xin lỗi vì không làm rõ chi tiết. Tôi đang sử dụng gói randomForest
cho vấn đề hồi quy (không phân loại). Đây là một chuỗi thời gian và mọi quan sát đều có trọng lượng của nó. Sau đó, trọng lượng này được sử dụng để xác định hiệu suất mô hình trên các quan sát kiểm tra. Biến y là liên tục.
Có thể thấy quan tâm nhiều hơn tại http://stats.stackexchange.com –