tôi có giá trị của một năm của dữ liệu theo giờ trong một khung dữ liệu trong R:tập hợp, tái cấu trúc dữ liệu chuỗi thời gian theo giờ trong R
> str(df.MHwind_load) # compactly displays structure of data frame
'data.frame': 8760 obs. of 6 variables:
$ Date : Factor w/ 365 levels "2010-04-01","2010-04-02",..: 1 1 1 1 1 1 1 1 1 1 ...
$ Time..HRs. : int 1 2 3 4 5 6 7 8 9 10 ...
$ Hour.of.Year : int 1 2 3 4 5 6 7 8 9 10 ...
$ Wind.MW : int 375 492 483 476 486 512 421 396 456 453 ...
$ MSEDCL.Demand: int 13293 13140 12806 12891 13113 13802 14186 14104 14117 14462 ...
$ Net.Load : int 12918 12648 12323 12415 12627 13290 13765 13708 13661 14009 ...
Trong khi duy trì cấu trúc theo giờ, tôi muốn biết làm thế nào để giải nén
- một tháng/nhóm đặc biệt của tháng
- ngày đầu tiên/tuần đầu tiên của mỗi tháng vv
- tất cả các ngày thứ Hai, tất cả các ngày thứ Ba vv của năm
Tôi đã thử sử dụng "cắt" không có kết quả và sau khi tìm kiếm trực tuyến, nghĩ rằng "lubridate" có thể làm như vậy nhưng chưa tìm thấy ví dụ phù hợp. Tôi rất muốn đánh giá cao sự giúp đỡ về vấn đề này.
Edit: một mẫu dữ liệu trong khung dữ liệu là dưới đây:
Date Hour.of.Year Wind.MW datetime
1 2010-04-01 1 375 2010-04-01 00:00:00
2 2010-04-01 2 492 2010-04-01 01:00:00
3 2010-04-01 3 483 2010-04-01 02:00:00
4 2010-04-01 4 476 2010-04-01 03:00:00
5 2010-04-01 5 486 2010-04-01 04:00:00
6 2010-04-01 6 512 2010-04-01 05:00:00
7 2010-04-01 7 421 2010-04-01 06:00:00
8 2010-04-01 8 396 2010-04-01 07:00:00
9 2010-04-01 9 456 2010-04-01 08:00:00
10 2010-04-01 10 453 2010-04-01 09:00:00
.. .. ... .......... ........
8758 2011-03-31 8758 302 2011-03-31 21:00:00
8759 2011-03-31 8759 378 2011-03-31 22:00:00
8760 2011-03-31 8760 356 2011-03-31 23:00:00
EDIT: bổ sung hoạt động theo thời gian tôi muốn thực hiện trên các tập dữ liệu cùng 1. Thực hiện giờ theo giờ trung bình cho tất cả các điểm dữ liệu tức là trung bình của tất cả các giá trị trong giờ đầu tiên của mỗi ngày trong năm. Đầu ra sẽ là "hồ sơ hàng giờ" của cả năm (24 điểm) 2. Thực hiện tương tự cho mỗi tuần và mỗi tháng tức là có được 52 và 12 cấu hình theo giờ tương ứng 3. Làm trung bình theo mùa, ví dụ cho tháng 6 Tháng Chín
Đây hoàn toàn là câu hỏi liên quan đến lập trình R, không có nội dung thống kê. Chúng tôi di chuyển các câu hỏi như vậy sang stackoverflow, vì ở đây chúng tôi có nhiều lập trình viên hơn. – mpiktas
Tôi đề nghị thêm một số dòng dữ liệu của bạn. Khung hình ở đây với dput. Tôi nghĩ chỉ có cột ngày tháng là đủ. – mpiktas
@mpiktas: Tôi đã thêm một mẫu từ khung dữ liệu của mình. lưu ý rằng tôi đã tạo datetime bằng cách sử dụng _timeSequence_ – avg