Tôi cố gắng đọc .txt với các giá trị bị thiếu bằng cách sử dụng pandas.read_csv. Dữ liệu của tôi có định dạng:tệp đọc có giá trị bị thiếu trong các chú gấu trúc trăn
10/08/2012,12:10:10,name1,0.81,4.02,50;18.5701400N,4;07.7693770E,7.92,10.50,0.0106,4.30,0.0301
10/08/2012,12:10:11,name2,,,,,10.87,1.40,0.0099,9.70,0.0686
với hàng nghìn mẫu có cùng tên điểm, vị trí gps và các chỉ số khác. Tôi sử dụng mã:
myData = read_csv('~/data.txt', sep=',', na_values='')
Mã sai vì na_values không cung cấp cho NaN hoặc chỉ báo khác. Các cột phải có cùng kích thước nhưng tôi hoàn thành với độ dài khác nhau.
Tôi không biết chính xác những gì nên được nhập sau khi na_values (đã thử tất cả những thứ khác nhau). Cảm ơn
Nếu bạn 'skiprows = 1', thì có một dòng duy nhất trong tệp. Không có tham số đó, tôi thấy rõ ràng 'NaN' trong DataFrame. – eumiro
Tôi chỉ đăng hai dòng dữ liệu của mình để hiển thị định dạng của nó. skiprows = 1 không làm bất cứ điều gì với dữ liệu bị thiếu, trong một tập tin gốc có 15000 dòng và dòng đầu tiên bao gồm một số tên, những gì tôi không muốn. – tomasz74
Tôi đã xóa 'skiprows = 1' để rõ ràng – tomasz74