Xem xét dataframe sauLàm thế nào để có điều kiện loại bỏ bản sao từ một dataframe gấu trúc
import pandas as pd
df = pd.DataFrame({'A' : [1, 2, 3, 3, 4, 4, 5, 6, 7],
'B' : ['a','b','c','c','d','d','e','f','g'],
'Col_1' :[np.NaN, 'A','A', np.NaN, 'B', np.NaN, 'B', np.NaN, np.NaN],
'Col_2' :[2,2,3,3,3,3,4,4,5]})
df
Out[92]:
A B Col_1 Col_2
0 1 a NaN 2
1 2 b A 2
2 3 c A 3
3 3 c NaN 3
4 4 d B 3
5 4 d NaN 3
6 5 e B 4
7 6 f NaN 4
8 7 g NaN 5
Tôi muốn loại bỏ tất cả các hàng mà là bản sao liên quan đến cột 'A' 'B'
. Tôi muốn xóa mục nhập có mục nhập NaN
(Tôi biết rằng đối với tất cả các chế độ sẽ có một số NaN
và mục nhập không phải là NaN
). Kết quả cuối cùng sẽ giống như thế này
A B Col_1 Col_2
0 1 a NaN 2
1 2 b A 2
2 3 c A 3
4 4 d B 3
6 5 e B 4
7 6 f NaN 4
8 7 g NaN 5
Tất cả hiệu quả, một lớp lót được hoan nghênh nhất
Để bảo vệ cử tri xuống, bạn có thể đã chọn ví dụ đơn giản là 'df.drop_duplicates' cho bạn câu trả lời bạn không muốn. –
có. Tôi chấp nhận downvote :) – mortysporty