Tôi có DataFrame có các hàng trùng lặp. Tôi muốn nhận được một DataFrame với một chỉ mục duy nhất và không có bản sao. Bạn có thể bỏ các giá trị trùng lặp. Điều này có thể không? Nó sẽ được thực hiện bởi groupby
?Pandas: dataframe duy nhất
Trả lời
In [29]: df.drop_duplicates()
Out[29]:
b c
1 2 3
3 4 0
7 5 9
Đã tìm ra một cách để thực hiện việc đó bằng cách đọc các ví dụ về tài liệu split-apply-combine.
df = pandas.DataFrame({'b':[2,2,4,5], 'c': [3,3,0,9]}, index=[1,1,3,7])
df_unique = df.groupby(level=0).first()
df
b c
1 2 3
1 2 3
3 4 0
7 5 9
df_unique
b c
1 2 3
3 4 0
7 5 9
này dựa trên các chỉ số hàng được nhân đôi cho hàng nơi các trường dữ liệu (b, c) được nhân đôi, làm cho hiệu quả phần chỉ số của hàng của bạn như là vector mà bạn muốn là duy nhất (không bị trùng lặp). – hobs
Nếu bạn đã sao chép mục nhập chỉ mục, đây là câu trả lời bạn muốn. – rogueleaderr
Tôi đã nhận 'ValueError: Chỉ mục chứa các mục trùng lặp, không thể định hình lại' khi thực hiện' unstack' trên MultIndex nhưng giải pháp này làm việc cho điều đó chỉ tôi phải làm 'df_unique = df.groupby (level = [0,1]). đầu tiên() ' – dashesy
- 1. Dataframe Merge in Pandas
- 2. Pandas: Lấy mẫu DataFrame
- 3. pandas DataFrame pivoting issue
- 4. Pandas DataFrame Áp dụng
- 5. Pandas thứ bậc dataframe
- 6. Py Pandas .format (dataframe)
- 7. Slice Pandas DataFrame by Row
- 8. Pandas DataFrame giá trị cập nhật Cột với DataFrame khác
- 9. Pandas DataFrame concat vs chắp thêm
- 10. 'CSV không tồn tại' - Pandas DataFrame
- 11. Pandas viết dataframe vào tệp CSV
- 12. Pandas DataFrame cắt theo ngày/giờ/phút
- 13. Tùy chọn Autoincrementing cho Pandas DataFrame index
- 14. Rẽ Pandas DataFrame các chuỗi vào histogram
- 15. Làm việc với set_index trong Pandas DataFrame
- 16. Kết hợp Pandas DataFrame DateTime Cột
- 17. Pandas HDFStore tải dataframe từ bộ nhớ
- 18. Áp dụng chức năng trên Pandas dataframe
- 19. Pandas: Tạo cột tổng hợp trong DataFrame
- 20. Xóa DataFrame hàng trong Pandas dựa trên giá trị cột
- 21. Tại sao pandas groupby(). Transform() yêu cầu một chỉ mục duy nhất?
- 22. Sắp xếp dữ liệu đọc từ Excel sang Pandas DataFrame
- 23. Rò rỉ bộ nhớ bằng cách sử dụng pandas dataframe
- 24. Lựa chọn hàng ngẫu nhiên trong Pandas dataframe
- 25. Cách cập nhật có điều kiện cột DataFrame trong Pandas
- 26. Làm thế nào để chuyển một cột trong Pandas DataFrame
- 27. Cách chuyển đổi bảng html thành pandas dataframe
- 28. Pandas DataFrame - chỉ mục mong muốn có giá trị trùng lặp
- 29. UNPIVOT Pandas liệu
- 30. pandas Python: Giữ cột được chọn làm DataFrame thay vì dòng
Điều đáng lưu ý là việc này xảy ra lần đầu tiên hoặc lần xuất hiện cuối cùng. Vì vậy, bạn cần phải sắp xếp theo một số lượng khác đầu tiên (nếu bạn may mắn) hoặc làm một số logic nhóm phức tạp anyway. – ely
Điều này là sai. drop_duplicates chỉ hoạt động trên các giá trị (ít nhất là trong phiên bản của tôi). Bạn cần đặt lại_index nếu bạn muốn thả chỉ mục và giá trị hoặc chỉ làm việc với chỉ mục nếu bạn muốn có chỉ mục duy nhất. Có thể có một cách khác ngoài groupby để thực thi chỉ mục duy nhất? – mathtick
Sử dụng 'df.drop_duplicates (inplace = True)' nếu bạn không muốn gán một biến mới. –