Tôi đang cố vẽ một chuỗi biểu đồ thời gian bằng Python. There has been a similar question about this, but in R. Vì vậy, về cơ bản, tôi cần điều tương tự, nhưng tôi thực sự xấu trong R. Thường có 48 giá trị mỗi ngày trong tập dữ liệu của tôi. Ở đâu - 9999 đại diện cho dữ liệu bị thiếu. Here's mẫu dữ liệu.Thời gian biểu đồ thị của biểu đồ trong Python
Tôi bắt đầu với việc đọc dữ liệu và xây dựng một pandas
DataFrame
.
import pandas as pd
df = pd.read_csv('sample.csv', parse_dates=True, index_col=0, na_values='-9999')
print df
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 336 entries, 2008-07-25 14:00:00 to 2008-08-01 13:30:00
Data columns (total 1 columns):
159.487691046 330 non-null values
dtypes: float64(1)
Bây giờ tôi có thể nhóm dữ liệu theo ngày:
daily = df.groupby(lambda x: x.date())
Nhưng sau đó tôi bị mắc kẹt. Tôi không biết làm thế nào để sử dụng điều này với matplotlib
để có được khoảng thời gian của tôi về biểu đồ. Bất kỳ trợ giúp nào được đánh giá cao, không nhất thiết phải sử dụng pandas
.
thêm vào sách nấu ăn! – Jeff
Cảm ơn! Điều này nên làm điều đó. Tôi hoàn toàn quên đề cập đến điều đó - 9999 là một số bị thiếu và nên bị hủy bỏ. Sẽ thêm nó vào câu hỏi. – abudis
Điều này rất tuyệt! –