Tôi đã đọc một tệp dữ liệu được phân định trong Windows với Pandas/Python mà không cần bất kỳ vấn đề. Tệp dữ liệu chứa các ghi chú trong ba dòng đầu tiên và sau đó đi kèm với một tiêu đề.Reading tab-delimited file với Pandas - hoạt động trên Windows, nhưng không phải trên Mac
df = pd.read_csv(myfile,sep='\t',skiprows=(0,1,2),header=(0))
Tôi hiện đang cố gắng đọc tệp này bằng máy Mac của mình. (Lần đầu tiên tôi sử dụng Python trên máy Mac.) Tôi nhận được lỗi sau.
pandas.parser.CParserError: Error tokenizing data. C error: Expected 1
fields in line 8, saw 39
Nếu thiết lập error_bad_lines luận cho read_csv-False, tôi nhận được thông tin sau đây, mà vẫn tiếp tục cho đến cuối dòng cuối cùng.
Skipping line 8: expected 1 fields, saw 39
Skipping line 9: expected 1 fields, saw 125
Skipping line 10: expected 1 fields, saw 125
Skipping line 11: expected 1 fields, saw 125
Skipping line 12: expected 1 fields, saw 125
Skipping line 13: expected 1 fields, saw 125
Skipping line 14: expected 1 fields, saw 125
Skipping line 15: expected 1 fields, saw 125
Skipping line 16: expected 1 fields, saw 125
Skipping line 17: expected 1 fields, saw 125
...
Tôi có cần chỉ định giá trị cho đối số mã hóa không? Có vẻ như tôi không cần phải đọc vì tệp này hoạt động tốt trên Windows.
Bạn đang sử dụng phiên bản chính xác của gấu trúc trên cả hai hệ điều hành? Bạn có thể cung cấp một số dữ liệu mẫu minh họa sự cố trên máy Mac không? – joris
không liên quan: bạn có hiểu sự khác biệt giữa: '(0)' và '(0,)' trong Python không? Lưu ý: '(0)' là '0' và' (0,) 'là' 0, '- dấu phẩy tạo một tuple (ngoại trừ một dấu trống), không phải dấu ngoặc đơn. – jfs
Bạn đã thử 'df = pd.read_table (myfile, skiprows = [0,1,2], header = 0)'? – pbreach