Tôi có csvs lớn, nơi tôi chỉ quan tâm đến một tập con của các hàng. Đặc biệt, tôi muốn đọc trong tất cả các hàng xảy ra trước khi một điều kiện cụ thể được đáp ứng.đọc có điều kiện hàng của csv trong gấu trúc
Ví dụ, nếu read_csv sẽ mang lại dataframe:
A B C
1 34 3.20 'b'
2 24 9.21 'b'
3 34 3.32 'c'
4 24 24.3 'c'
5 35 1.12 'a'
...
1e9 42 2.15 'd'
là có một số cách để đọc tất cả các hàng trong csv cho đến khi col B vượt quá 10. Trong ví dụ trên, tôi muốn đọc trong:
A B C
1 34 3.20 'b'
2 24 9.21 'b'
3 34 3.32 'c'
4 24 24.3 'c'
tôi biết làm thế nào để ném những hàng này ra sau khi đã đọc dataframe trong, nhưng vào thời điểm này tôi đã dành tất cả những gì tính toán đọc chúng trong tôi không có quyền truy cập vào các chỉ số. của hàng cuối cùng trước khi đọc csv (no skipfooter)
Tôi không nghĩ có một cách đơn giản để làm điều này trong API Pandas. Có thể bạn sẽ phải thoát ra khỏi 'csv', lấy từng hàng một, đặt chúng vào danh sách các danh sách, dừng lại khi bạn nhận được hàng cuối cùng mà bạn muốn, và sau đó xây dựng một' DataFrame' ra khỏi danh sách kết quả của danh sách. –
Bạn có thể đọc csv theo khối và chỉ nối thêm nếu tập hợp con đáp ứng điều kiện của bạn – EdChum