Tôi đang cố tính toán các phương tiện cán của tập dữ liệu không cân bằng. Để minh họa cho quan điểm của tôi tôi đã sản xuất ví dụ đồ chơi này của dữ liệu của tôi:Tạo ra mức trung bình cán của tất cả các quan sát trước trên mỗi ID trong bộ dữ liệu bảng không cân bằng
ID year Var RollingAvg(Var)
1 2000 2 NA
1 2001 3 2
1 2002 4 2.5
1 2003 2 3
2 2001 2 NA
2 2002 5 2
2 2003 4 3.5
Cột RollingAvg(Var)
là những gì tôi muốn, nhưng không thể có được. Nói cách, tôi đang tìm kiếm trung bình cán của tất cả các quan sát trước đây của Var
cho mỗi ID
. Tôi đã thử sử dụng rollapply
và ddply
trong gói zoo
và gói plyr
, nhưng tôi không thể biết cách đặt độ dài cửa sổ cuộn để sử dụng TẤT CẢ các quan sát trước đó cho mỗi ID. Có lẽ tôi nên sử dụng gói plm thay thế? Bất kỳ trợ giúp được đánh giá cao.
Tôi đã xem các bài đăng khác trên các phương tiện cán trên bộ dữ liệu bảng BALANCED, nhưng tôi không thể ngoại suy câu trả lời của họ cho dữ liệu không cân bằng.
Cảm ơn,
M
tôi không hiểu tại sao hàng thứ 5 của 'RollingAvg (Var)' 'NA'? –
Tôi nghĩ rằng đó là tính toán cho mỗi 'ID' – Metrics
Sản lượng dự kiến của bạn có chính xác không? – Metrics