Khi tôi thả John
như trùng lặp xác định 'tên' như tên cột:Làm thế nào để giảm trùng lặp khỏi DataFrame có tính đến giá trị tài khoản của một cột
import pandas as pd
data = {'name':['Bill','Steve','John','John','John'], 'age':[21,28,22,30,29]}
df = pd.DataFrame(data)
df = df.drop_duplicates('name')
gấu trúc xuống tất cả các đơn vị phù hợp với rời khỏi trái nhất:
age name
0 21 Bill
1 28 Steve
2 22 John
Thay vào đó tôi muốn giữ hàng mà tuổi của John là cao nhất (trong ví dụ này nó là 30. Làm thế nào để đạt được điều này tuổi?
thử điều này: 'df.drop_duplicates ('name', giữ = 'cuối cùng')' hoặc 'df.sort_values ('tuổi') .drop_duplicates ('name', keep = 'last') ' – MaxU