2010-07-26 35 views
7

Tôi đang chạy mô hình hồi quy logistic trong R. Tôi đã sử dụng cả gói Zelig và Car. Tuy nhiên, tôi tự hỏi nếu có một cách đơn giản để có được các mô hình thống kê phù hợp cho mô hình. (giả R-square, chi vuông, log liklihood, vv)Thống kê mô hình phù hợp cho một hồi quy logistic

+0

Bạn có thể tìm thấy một vài ví dụ tại đây: http://www.ats.ucla.edu/stat/r/dae/mlogit.htm – nico

+0

Có vẻ như bạn có câu trả lời bạn thích (bên dưới), bạn có sẵn lòng chọn nó làm câu trả lời ưa thích của bạn? –

+1

Bạn có thể thấy rằng trang Hỏi đáp này tốt hơn cho các câu hỏi về thống kê: http://stats.stackexchange.com/ –

Trả lời

1

Thông thường việc này được thực hiện bằng chức năng summary().

+0

tóm tắt() cung cấp cho tôi các hệ số và các thông số hồi quy. Điều đó quan trọng, nhưng không phải những gì tôi đang tìm kiếm. Bên cạnh đó, với sản lượng Zelig, tôi nhận được kết quả như sau: lệch Null: 1068,24 trên 772 bậc tự do lệch dư: 939,48 trên 761 bậc tự do (941 quan sát xóa do missingness) AIC: 963,48 – Tony

+1

cảm ơn!!! Tôi cũng thấy rằng việc chạy hồi quy logistic bằng cách sử dụng hàm lrm từ gói Design cho ra giả-R^2 làm đầu ra. – Tony

1

Thật khó để trả lời câu hỏi này mà không biết đối tượng mô hình là gì. Tôi không chắc chắn những gì Zelig sản xuất.

Tôi sẽ xem names(model), names(summary(model)) hoặc names(anova(model,test = "Chisq")) để xem liệu thống kê bạn muốn có ở đó không. Tôi biết rằng đối với khả năng đăng nhập, logLik(model) sẽ cung cấp cho bạn những gì bạn muốn.

1

Trong khi tôi không có chuyên gia, mô hình thống kê phù hợp cho các mô hình hồi quy hậu cần không đơn giản trong cách diễn giải của chúng như là những người trong hồi quy tuyến tính. Giả sử bạn có phản hồi nhị phân, một phương pháp tôi thấy hữu ích là nhóm dữ liệu của bạn theo khoảng xác suất dự đoán (0-10%, 10% -20%, .... 90% -100%) và so sánh xác suất thực tế cho những người được dự đoán. Điều này rất hữu ích vì thường thì mô hình của bạn sẽ vượt quá dự đoán ở mức thấp hoặc dự đoán ở mức cao. Điều này có thể dẫn đến một mô hình tốt hơn.

4

Giả sử glm1 ist mô hình của bạn và mẫu của bạn là n = 100.

Dưới đây là một vài tiện ích-of-fit-biện pháp:

R2<-1-((glm1$deviance/-2)/(glm1$null.deviance/-2)) cat("mcFadden R2=",R2,"\n")

R2<-1-exp((glm1$deviance-glm1$null.deviance)/2*n) cat("Cox-Snell R2=",R2,"\n")

R2<-R2/(1-exp((-glm1$null.deviance)/n)) cat("Nagelkerke R2=",R2,"\n")

AIC<- glm1$deviance+2*2 cat("AIC=",AIC,"\n")

Bằng cách này bạn có một cái nhìn tổng quan về cách tính toán GoF-Measurements.

+0

Chỉ là một bổ sung ngắn về chủ đề này: Các phép đo GoF phụ thuộc vào giá trị Loglikelihood, tại sao chúng được coi là không giống như R-Squares bình thường. Giá trị McFadden là 0,2 không có nghĩa là 20% phương sai được mô tả bởi mô hình, vì vậy nó không giống với R-Square được tính bằng OLS. Nhưng trong hầu hết các mô hình một giá trị của Pseudo R-Squares> = 0,2 là yên tĩnh tốt. – Redfood

Các vấn đề liên quan