Tôi có hai tập hợp ngày nhiệt độ, có số đọc tại các khoảng thời gian thông thường (nhưng khác nhau). Tôi đang cố gắng để có được sự tương quan giữa hai bộ dữ liệu này.Cách lấy mối tương quan giữa hai khoảng thời gian sử dụng Pandas
Tôi đã chơi với Pandas để cố gắng thực hiện việc này. Tôi đã tạo hai lần kiểm tra và đang sử dụng TimeSeriesA.corr(TimeSeriesB)
. Tuy nhiên, nếu thời gian trong 2 timeSeries không khớp chính xác (chúng thường giảm dần theo giây), tôi nhận được Null như một câu trả lời. Tôi có thể nhận được một câu trả lời đàng hoàng nếu tôi có thể:
a) suy/fill lần thiếu trong mỗi chuỗi thời gian (Tôi biết điều này là có thể trong Pandas, tôi chỉ không biết làm thế nào để làm điều đó)
b) tách số giây ra khỏi đối tượng ngày giờ trăn (Đặt giây thành 00, không thay đổi phút). Tôi sẽ mất một mức độ chính xác, nhưng không phải là một số tiền rất lớn
c) Sử dụng một cái gì đó khác trong Pandas để có được mối tương quan giữa hai chuỗi thời gian
d) Sử dụng một cái gì đó trong python để có được mối tương quan giữa hai danh sách float, mỗi float có một đối tượng datetime tương ứng, có tính đến thời gian.
Bất kỳ ai có bất kỳ đề xuất nào?
Ha, bạn đã nhận được nó trước khi tôi có thể: -) ... –
Nếu tôi đọc phần cuối cùng bên phải, phần cuối cùng tính trung bình cho các giá trị trong khoảng từ 00 đến 60 giây (giá trị trung bình của XX: XX: 30, không phải XX: XX: 00) và gán kết quả là XX: XX : 00. Cách đơn giản xung quanh điều này sẽ là 'date.replace (second = 30)', một cách quá phức tạp để lấy số trung bình mỗi phút sẽ là: 'ts_mean = seriesT.groupby (lambda date: date.replace (second = 0) nếu date.second <30 else date.replace (giây = 0) + timedelta (phút = 1)). mean() ' – user814005