2012-10-17 32 views
11

Tôi có mô hình hồi quy với kết quả nhị phân. Tôi trang bị mô hình với glmnet và có các biến được lựa chọn và hệ số của chúng.Tại sao không thể nhận được thông tin tóm tắt thống kê cho các hệ số hồi quy từ mô hình glmnet?

Vì glmnet không tính toán tầm quan trọng của biến, tôi muốn cho đầu ra chính xác (các biến được lựa chọn và hệ số của chúng) để tìm thông tin (lỗi chuẩn, v.v.).

Tôi đã tìm kiếm tài liệu r, có vẻ như tôi có thể sử dụng tùy chọn "phương pháp" trong chế độ glm để chỉ định chức năng do người dùng xác định. Nhưng tôi không làm như vậy, ai đó có thể giúp tôi với điều này?

+0

ví dụ tái sản xuất được không? http://tinyurl.com/reproducible-000 –

+0

Tôi không có một ví dụ ngay bây giờ, nhưng, để đơn giản hóa câu hỏi một chút. Giả sử tôi có công thức đầu ra từ glmnet là y = 2.3 * x1 + 3.1 * x2 + 0.9 * x3. Làm thế nào để tôi chỉ định formular này trong glm để nó được thao tác? – TongZZZ

+0

không thể tái sản xuất, nhưng nó mang lại cho tôi một ý tưởng tốt hơn một chút. Tôi nghĩ bạn có thể không làm được những gì bạn muốn: nghĩa là bạn có thể nuôi một mô hình được chỉ định đầy đủ bằng cách chỉ định nó như là một thuật ngữ bù đắp, nhưng tôi không chắc nó có thể tính toán tầm quan trọng biến đổi từ điểm bắt đầu đó.Bạn đã từng nghĩ về việc sử dụng gói 'caret', một dạng co rút bằng cách lấy trung bình trên các mô hình * và * cung cấp thông tin về tầm quan trọng biến đổi? –

Trả lời

26

"Đó là một câu hỏi rất tự nhiên để xin lỗi tiêu chuẩn của hồi quy hệ số hoặc số lượng ước tính khác. Về nguyên tắc như vậy tiêu chuẩn lỗi có thể dễ dàng được tính toán, ví dụ như sử dụng bootstrap.

Tuy nhiên, điều này Lý do cho điều này là các lỗi tiêu chuẩn không phải là rất có ý nghĩa đối với các ước tính thiên vị mạnh mẽ như phát sinh từ các phương pháp ước tính bị phạt. ias. Do đó, thiên lệch của mỗi bộ ước tính là một thành phần chính của sai số bình phương của nó, trong khi phương sai của nó chỉ có thể đóng góp một phần nhỏ.

Thật không may, trong hầu hết các ứng dụng của hồi quy bị phạt nó là không thể có được ước tính chính xác đủ về độ lệch. Bất kỳ tính toán nào dựa trên tính năng khởi động chỉ có thể đưa ra đánh giá về phương sai của các ước tính . Ước tính đáng tin cậy về độ lệch chỉ là khả dụng nếu ước tính không thiên vị đáng tin cậy có sẵn, là thường không phải là trường hợp trong đó các ước tính bị phạt là được sử dụng.

Báo cáo lỗi chuẩn của ước tính bị phạt do đó chỉ cho biết chỉ là một phần của câu chuyện. Nó có thể tạo ra một ấn tượng sai lầm về độ chính xác tuyệt vời của , hoàn toàn bỏ qua sự không chính xác do sự thiên vị gây ra. Nó chắc chắn là một sai lầm khi lập báo cáo niềm tin rằng chỉ dựa trên đánh giá của phương sai của các ước tính, chẳng hạn như khoảng tin cậy bootstrap dựa trên làm."

Jelle Goeman, Ph.D. Leiden University, Author of the Penalized package in R.

+0

Rất lý giải tại sao S.E. không được cung cấp! – TongZZZ

0

Tôi đã thấy mọi người chỉ cần chạy một glm bằng cách sử dụng các yếu tố dự đoán được chọn bởi glmnet. Và cũng có gói CRAN hdi ví dụ như cung cấp suy luận cho các mô hình chiều cao, bạn có thể muốn xem ...

Các vấn đề liên quan