2013-09-02 34 views
6

Tôi sử dụng gstat để dự đoán dữ liệu nhị thức, nhưng giá trị được dự đoán vượt quá 1 và dưới 0. Có ai biết cách tôi có thể giải quyết vấn đề này không? Cảm ơn.Hồi quy kriging dữ liệu nhị thức

data(meuse) 
data(meuse.grid) 
coordinates(meuse) <- ~x+y 
coordinates(meuse.grid) <- ~x+y 
gridded(meuse.grid) <- TRUE 

#glm model 
glm.lime <- glm(lime~dist+ffreq, meuse, family=binomial(link="logit")) 
summary(glm.lime) 

#variogram of residuals 
var <- variogram(lime~dist+ffreq, data=meuse) 
fit.var <- fit.variogram(var, vgm(nugget=0.9, "Sph", range=sqrt(diff([email protected]\[1,\])^2 + diff([email protected]\[2,\])^2)/4, psill=var(glm.lime$residuals))) 
plot(var, fit.var, plot.nu=T) 

#universal kriging 
kri <- krige(lime~dist+ffreq, meuse, meuse.grid, fit.var) 
spplot(kri[1]) 

enter image description here

Trả lời

3

Nói chung, với cách tiếp cận này Kriging hồi quy không có đảm bảo rằng mô hình sẽ có hiệu lực như tính toán của xu hướng này và dư được tách ra. Một vài lưu ý trên mã của bạn. Lưu ý rằng bạn sử dụng variogram để tính toán phương sai còn lại, nhưng variogram sử dụng mô hình tuyến tính bình thường để tính toán xu hướng và do đó cũng là số dư. Bạn cần xác định số dư của mình từ số glm và sau đó tính toán phương sai còn lại dựa trên đó.

Bạn có thể thực hiện việc này theo cách thủ công hoặc xem chức năng fit.gstatModel từ gói GSIF. Bạn cũng có thể xem binom.krige từ gói geoRglm. This thread vào R-sig-geo cũng có thể là thú vị:

Lấy residuas từ một GLM là khá khác nhau từ việc sử dụng chỉ số biến. Ngoài ra, thậm chí có thể có một số khác biệt tùy thuộc vào loại số dư mà bạn sử dụng. Chạy GLM và khám phá số dư ví dụ: thông qua các biến thể, là một cái gì đó tôi xem xét một thực hành thường lệ, nhưng nó không aways cho bạn biết toàn bộ câu chuyện. Lắp một GLGM (mô hình địa lý tuyến tính phóng đại) có thể mang tính thuyết phục hơn kể từ bạn có thể thực hiện infereces trên các tham số mô hình và truy cập mức độ liên quan của thuật ngữ không gian khách quan hơn. Đây là động lực ban đầu cho geoRglm thực hiện tất cả mô hình cùng một lúc chứ không phải bằng hai bước như vậy như phù hợp với mô hình mà không có sự tương quan và sau đó mô hình hóa số dư. Điều này đi kèm với gánh nặng thêm của hiệu chỉnh các thuật toán MCMC. SpBayes sau đó đã xuất hiện và thực sự có vẻ như đang đề xuất một khung chung chung hơn trong khi geoRglm là đặc trưng cho các mô hình nhị thức và độc độc lập.

Như Roger nói rằng có phạm vi để chơi xung quanh với lựa chọn thay thế khác như GLMM hoặc có thể MCMCpack, nhưng điều này chắc chắn là chưa sẵn sàng "out-of-the-box" và mã sẽ cần phải được điều chỉnh cho không gian mục đích.

Các vấn đề liên quan