Tôi có chuỗi thời gian bất thường của sự kiện (bài đăng) sử dụng xts
và tôi muốn tính số sự kiện xảy ra trên cửa sổ hàng tuần (hoặc hai tuần một lần hoặc 3 ngày, v.v.). Các dữ liệu trông như thế này:Cửa sổ cuốn theo chuỗi thời gian bất thường
postid
2010-08-04 22:28:07 867
2010-08-04 23:31:12 891
2010-08-04 23:58:05 901
2010-08-05 08:35:50 991
2010-08-05 13:28:02 1085
2010-08-05 14:14:47 1114
2010-08-05 14:21:46 1117
2010-08-05 15:46:24 1151
2010-08-05 16:25:29 1174
2010-08-05 23:19:29 1268
2010-08-06 12:15:42 1384
2010-08-06 15:22:06 1403
2010-08-07 10:25:49 1550
2010-08-07 18:58:16 1596
2010-08-07 21:15:44 1608
mà nên sản xuất cái gì đó như
nposts
2010-08-05 00:00:00 10
2010-08-06 00:00:00 9
2010-08-07 00:00:00 5
cho một cửa sổ 2 ngày. Tôi đã xem xét rollapply
, apply.rolling
từ PerformanceAnalytics
, v.v ... và tất cả đều giả định dữ liệu chuỗi thời gian thường xuyên. Tôi đã cố gắng thay đổi tất cả các lần để chỉ ngày bài viết xảy ra và sử dụng một cái gì đó như ddply
để nhóm trên mỗi ngày, mà được tôi gần gũi. Tuy nhiên, người dùng có thể không đăng bài mỗi ngày, do đó, chuỗi thời gian sẽ vẫn không thường xuyên. Tôi có thể điền vào những khoảng trống với 0, nhưng điều đó có thể làm tăng dữ liệu của tôi rất nhiều và nó đã khá lớn.
Tôi nên làm gì?
Giải pháp cho điều này hiện không tồn tại trong gói XTS, nhưng yêu cầu này đi lên đủ mà tôi đã bắt đầu suy nghĩ về bao gồm một giải pháp. –
Bạn có cập nhật @JoshuaUlrich không? Hoặc một cái gì đó để có hiệu lực của câu trả lời dưới đây sẽ điền vào những ngày mất tích với dữ liệu zero hoặc NA để chúng ta có thể sử dụng 'rollapply'? Tôi đoán tôi có thể sử dụng 'hợp nhất' ... – flodel
@ flodel: câu hỏi này không đòi hỏi những gì tôi nghĩ nó đã làm (xem câu trả lời của tôi). Tôi nghĩ rằng họ muốn nhìn lại 'n' ngày ở mọi quan sát trong chuỗi ban đầu của họ, đó là một vấn đề khó giải quyết hơn nhiều. –