Có cách nào để có điều kiện thả trùng lặp (sử dụng drop_duplicates cụ thể) trong một khung dữ liệu gấu trúc w/khoảng 10 cột và 400.000 hàng? Đó là, tôi muốn giữ tất cả các hàng có 2 cột đáp ứng một điều kiện: nếu sự kết hợp của ngày (cột) và lưu trữ (cột) # là duy nhất, giữ hàng, khác khôn ngoan, thả.Có điều kiện loại bỏ trùng lặp gấu trúc python
Trả lời
Sử dụng drop_duplicates
trở dataframe với hàng trùng lặp loại bỏ, tùy chọn chỉ xem xét một số cột
Hãy dataframe ban đầu giống như
In [34]: df
Out[34]:
Col1 Col2 Col3
0 A B 10
1 A B 20
2 A C 20
3 C B 20
4 A B 20
Nếu bạn muốn đi kết hợp độc đáo từ các cột nhất định 'Col1', 'Col2'
In [35]: df.drop_duplicates(['Col1', 'Col2'])
Out[35]:
Col1 Col2 Col3
0 A B 10
2 A C 20
3 C B 20
Nếu bạn muốn kết hợp độc đáo tất cả các cột
In [36]: df.drop_duplicates()
Out[36]:
Col1 Col2 Col3
0 A B 10
1 A B 20
2 A C 20
3 C B 20
Cảm ơn bạn. Tôi nghĩ rằng bạn đã có thể làm sáng tỏ một số nhầm lẫn tôi có về combo. –
@Morgan Sacco: Nếu câu trả lời này phù hợp với bạn, bạn nên đánh dấu nó là được chấp nhận. – ssoler
- 1. Loại bỏ trùng lặp bằng Python
- 2. hàng trùng lặp trong gấu trúc DF
- 3. Loại bỏ trùng lặp -
- 4. gấu trúc python có điều kiện tổng tích lũy
- 5. python gấu trúc dataframe: loại bỏ hàng chọn
- 6. Python loại bỏ các từ dừng từ gấu trúc dataframe
- 7. Làm thế nào để có điều kiện loại bỏ bản sao từ một dataframe gấu trúc
- 8. Loại bỏ trùng lặp nhanh trong numpy và python
- 9. Thay thế có điều kiện trong gấu trúc
- 10. cột số học có điều kiện trong gấu trúc dataframe
- 11. Pandas: loại bỏ trùng lặp ngược từ dataframe
- 12. jquery loại bỏ trùng lặp li
- 13. GROUP BY không loại bỏ trùng lặp
- 14. đọc có điều kiện hàng của csv trong gấu trúc
- 15. R, có điều kiện xóa các hàng trùng lặp
- 16. pandas trăn loại bỏ trùng lặp trong loạt
- 17. khoản tiền điều kiện cho tổng hợp gấu trúc
- 18. Loại bỏ đăng nhập trùng lặp trong log4net
- 19. gấu trúc: nhóm lọc theo nhiều điều kiện?
- 20. Java Nhiều thừa kế, loại bỏ mã trùng lặp
- 21. Loại bỏ trùng lặp bằng so sánh tùy chỉnh
- 22. Loại bỏ các bản ghi trùng lặp trong Bảng BigQuery
- 23. php mảng đa chiều loại bỏ trùng lặp
- 24. Làm cách nào để loại bỏ mã trùng lặp?
- 25. Loại bỏ trùng lặp bằng phân vùng bởi SQL Server
- 26. Ruby loại bỏ các đối tượng trùng lặp khỏi mảng
- 27. Loại bỏ các hàng trùng lặp từ một bảng
- 28. Python gấu trúc nhóm dataframe bởi dựa trên một điều kiện
- 29. Lỗi loại trùng lặp?
- 30. VBA - cách bỏ qua vòng lặp for có điều kiện
Bạn đã thử gì? Có những câu lệnh 'if' cuối cùng có ích, nhưng sau đó có, điều đó có thể hơi lộn xộn một chút. Bạn đã kiểm tra xem có phương pháp nào trong tài liệu hướng dẫn về điều này không? – Zizouz212
Sẽ luôn hữu ích khi đăng dữ liệu mẫu và đầu ra dự kiến. – Zero
có, tôi đang cố gắng tìm ra cách đăng một số dữ liệu mẫu. –