Tôi đang tìm kiếm một cách để làm tương đương với sqlCách "chọn riêng biệt" trên nhiều cột khung dữ liệu trong gấu trúc?
"SELECT DISTINCT col1, col2 TỪ dataframe_table"
Các gấu trúc sql so sánh không có bất cứ điều gì về "khác biệt" .unique() chỉ hoạt động cho một cột duy nhất, vì vậy tôi cho rằng tôi có thể concat các cột, hoặc đặt chúng trong một danh sách/tuple và so sánh theo cách đó, nhưng điều này có vẻ như một cái gì đó gấu trúc nên làm theo một cách bản địa hơn .
Tôi có thiếu điều gì đó hiển nhiên hay không có cách nào để thực hiện việc này?
Bạn sẽ phải làm điều gì đó như 'df.apply (pd.Series.unique)' nhưng điều này sẽ không hoạt động nếu số lượng giá trị duy nhất thay đổi trên các cột, do đó bạn phải xây dựng một dict của các tên cột làm khóa và các giá trị duy nhất như các giá trị – EdChum
[SO Documentation] (http://stackoverflow.com/documentation/pandas/1751/indexing-and-select-data/26077/select-distinct-rows-across-dataframe) – user2314737