Đây là một khung dữ liệu mẫu:Lưu gấu trúc DataFrame sử dụng h5py cho interoperabilty với các độc giả hdf5 khác
import pandas as pd
NaN = float('nan')
ID = [1, 2, 3, 4, 5, 6, 7]
A = [NaN, NaN, NaN, 0.1, 0.1, 0.1, 0.1]
B = [0.2, NaN, 0.2, 0.2, 0.2, NaN, NaN]
C = [NaN, 0.5, 0.5, NaN, 0.5, 0.5, NaN]
columns = {'A':A, 'B':B, 'C':C}
df = pd.DataFrame(columns, index=ID)
df.index.name = 'ID'
print(df)
A B C
ID
1 NaN 0.2 NaN
2 NaN NaN 0.5
3 NaN 0.2 0.5
4 0.1 0.2 NaN
5 0.1 0.2 0.5
6 0.1 NaN 0.5
7 0.1 NaN NaN
Tôi biết rằng gấu trúc có pytables dựa HDFStore, đó là một cách dễ dàng để serialize/deserialize một dữ liệu một cách hiệu quả khung. Nhưng những bộ dữ liệu này không phải là rất dễ dàng để tải trực tiếp bằng cách sử dụng một đầu đọc h5py hoặc matlab. Làm thế nào tôi có thể lưu một khung dữ liệu bằng cách sử dụng h5py, để tôi có thể dễ dàng tải nó trở lại bằng cách sử dụng một đầu đọc hdf5?
Tôi đã sử dụng các đối số mặc định của định dạng 'cố định' mà không thiết lập data_columns, trong đó có một bộ dữ liệu hdf5 tìm khác nhau và trừu tượng hơn khi sử dụng format = 'table', data_columns = True. Đối với tài liệu gấu trúc về khả năng tương thích bên ngoài với HDFStore, tôi đọc lại nó và sẽ không bao giờ thấy câu trả lời của bạn từ mô tả đó. Cảm ơn câu trả lời rõ ràng và hữu ích của bạn! – Phil
nếu bạn muốn thêm một số bình luận thêm vào ví dụ tài liệu đó sẽ là awseome! xin gửi yêu cầu kéo – Jeff
Tôi muốn thêm vào ví dụ về tài liệu, nhưng tôi đang gặp sự cố. Xem http://stackoverflow.com/questions/30807270 để biết câu hỏi tiếp theo. – Phil