Giả sử tôi có một dataframe như sau:Áp dụng các chức năng khác nhau đến các mục khác nhau trong nhóm đối tượng: Python gấu trúc
In [1]: test_dup_df
Out[1]:
exe_price exe_vol flag
2008-03-13 14:41:07 84.5 200 yes
2008-03-13 14:41:37 85.0 10000 yes
2008-03-13 14:41:38 84.5 69700 yes
2008-03-13 14:41:39 84.5 1200 yes
2008-03-13 14:42:00 84.5 1000 yes
2008-03-13 14:42:08 84.5 300 yes
2008-03-13 14:42:10 84.5 88100 yes
2008-03-13 14:42:10 84.5 11900 yes
2008-03-13 14:42:15 84.5 5000 yes
2008-03-13 14:42:16 84.5 3200 yes
Tôi muốn nhóm một dữ liệu trùng lặp lúc 14:42:10
và áp dụng các chức năng khác nhau để exe_price
và exe_vol
(ví dụ , cộng số exe_vol
và tính trung bình theo khối lượng là exe_price
). Tôi biết rằng tôi có thể làm
In [2]: grouped = test_dup_df.groupby(level=0)
vào nhóm các chỉ số trùng lặp và sau đó sử dụng first()
hoặc last()
chức năng để có được một trong hai người đầu tiên hoặc hàng cuối cùng nhưng điều này là không thực sự những gì tôi muốn.
Có cách nào để nhóm và sau đó áp dụng các hàm khác nhau (được viết bởi tôi) cho các giá trị trong cột khác nhau không?
Này sẽ không cho tôi hai dataframe riêng biệt? Tôi muốn có nó trong một dataframe (tương tự như một đầu ra của grouped.first() hoặc grouped.last()). Tôi có thể thiếu một cái gì đó ?? – kunitomo