tôi có một tập hợp dữ liệu mà trông như thế này (ít nhất là 5 cột - nhưng có thể ít hơn)Xử lý Variable Số cột với Pandas - Python
1,2,3
1,2,3,4
1,2,3,4,5
1,2
1,2,3,4
....
Tôi cố gắng để sử dụng gấu trúc read_table để đọc vào khung dữ liệu 5 cột. Tôi muốn đọc điều này mà không cần xoa bóp thêm.
Nếu tôi cố gắng
import pandas as pd
my_cols=['A','B','C','D','E']
my_df=pd.read_table(path,sep=',',header=None,names=my_cols)
tôi nhận được một lỗi - "tên cột có 5 lĩnh vực, dữ liệu có 3 lĩnh vực".
Có cách nào để làm cho gấu trúc điền vào NaN cho các cột bị thiếu trong khi đọc dữ liệu không?
Cảm ơn bạn! Điều này làm việc - động cơ = 'python' có vẻ là chìa khóa. Việc thêm thuộc tính này làm cho cả công việc read_table và read_csv đều hoạt động. –
Điều này có vẻ khá xa với tôi. Thêm một vấn đề github: https://github.com/pydata/pandas/issues/2981 –
Điều này hoạt động chính xác ngay bây giờ BTW mà không 'engine = 'python'' –