2017-05-15 32 views
6

Tôi có tệp dữ liệu từ cột A-G như dưới đây nhưng khi tôi đọc nó với pd.read_csv('data.csv'), nó in thêm một cột unnamed ở cuối không có lý do gì.Xóa các cột chưa đặt tên trong khung dữ liệu gấu trúc

colA ColB colC colD colE colF colG Unnamed: 7 
44  45  26  26  40  26  46  NaN 
47  16  38  47  48  22  37  NaN 
19  28  36  18  40  18  46  NaN 
50  14  12  33  12  44  23  NaN 
39  47  16  42  33  48  38  NaN 

Tôi đã thấy tệp dữ liệu của mình nhiều lần nhưng tôi không có thêm dữ liệu trong bất kỳ cột nào khác. Làm thế nào tôi nên loại bỏ cột này trong khi đọc? Cảm ơn

+1

cột đầu tiên của bạn có lẽ là col index thấy liên quan: http://stackoverflow.com/questions/ 36519086/pandas-how-to-get-rid-of-không có tên-cột-trong-một-dataframe – EdChum

Trả lời

13
In [162]: df.loc[:, ~df.columns.str.contains('^Unnamed')] 
Out[162]: 
    colA ColB colC colD colE colF colG 
0 44 45 26 26 40 26 46 
1 47 16 38 47 48 22 37 
2 19 28 36 18 40 18 46 
3 50 14 12 33 12 44 23 
4 39 47 16 42 33 48 38 

nếu cột đầu tiên có giá trị chỉ số, sau đó bạn có thể làm điều này thay vì:

pd.read_csv('data.csv', index_col=0) 
Các vấn đề liên quan