Tôi muốn thực hiện thao tác nối/hợp nhất/nối thêm trên một khung dữ liệu với chỉ mục datetime.tham gia hoặc hợp nhất với ghi đè trong gấu trúc
Giả sử tôi có df1
và tôi muốn thêm df2
vào đó. df2
có thể có ít hoặc nhiều cột và chỉ mục trùng lặp. Đối với tất cả các hàng trong đó các chỉ mục khớp nhau, nếu df2
có cùng một cột là df1
, tôi muốn các giá trị của df1
được ghi đè với các giá trị từ df2
.
Làm cách nào để có được kết quả mong muốn?
Tôi nghĩ điều này thực sự là điều tôi muốn, cảm ơn rất nhiều. – saroele
Có một vấn đề với 'combined_first' - sử dụng nó để kết hợp ba dataframes của một số hàng 30k mỗi bộ vượt qua tất cả bộ nhớ của tôi. Bất kỳ cách nào xung quanh điều này? – scry
Tôi nghĩ nó sẽ trực quan hơn nhiều nếu chức năng này là một phần của hàm 'df.update' với tham số tùy chọn' join = 'outer'' (hiện tại chỉ 'left' được thực hiện). Trong trường hợp của tôi, 'df2' (tính từ' df1') có ít cột hơn 'df1' (nhưng một số không nằm trong' df1') và tôi muốn cập nhật 'df1' với các giá trị được tính nếu có thể cộng với các cột bổ sung. Đối với điều này, tôi nghĩ rằng 'df1.update (df2, join = 'outer')' sẽ dễ hiểu hơn nhiều so với 'df1 = df2.combine_first (df1)'. PS. Đây là một câu hỏi nhỏ, nhưng nếu không thì 'pandas' gần như là tuyệt vời! =) – Axel