Nhóm gấu trúc theo và tổng hai cột

Câu hỏi mới bắt đầu. Điều này có vẻ như nó phải là một hoạt động đơn giản, nhưng tôi không thể tìm ra nó từ việc đọc tài liệu.Nhóm gấu trúc theo và tổng hai cột

Tôi có một df với cấu trúc này:

|integer_id|int_field_1|int_field_2|

Cột integer_id là không duy nhất, vì vậy tôi muốn nhóm df bởi integer_id và tổng hợp hai lĩnh vực.

SQL tương đương là:

SELECT integer_id, SUM(int_field_1), SUM(int_field_2) FROM tbl 
GROUP BY integer_id

Mọi góp ý về cách đơn giản nhất để làm điều này?

EDIT:. Bao gồm đầu vào/đầu ra

Input: 
integer_id int_field_1 int_field_2 
2656  36   36 
2656  36   36 
9702  2   2 
9702  1   1

Ouput sử dụng df.groupby ('integer_id') sum():

integer_id int_field_1 int_field_2 
2656  72   72 
9702  3   3

Nguồn

2014-08-27 acpigeon

làm 'df.groupby ('integer_id'). Sum() 'cung cấp cho bạn những gì bạn muốn? – EdChum

Ah vâng có vẻ như hầu hết đều hoạt động. Hàng đầu tiên của đầu ra bao gồm 'integer_id' với hai trường trống mặc dù tôi không hiểu. – acpigeon

Đó có lẽ chỉ là biểu diễn của khung dữ liệu, vì 'integer_id' được đặt làm chỉ mục. Bạn có thể cung cấp 'set_index = False' trong' groupby' nếu bạn không muốn 'integer_id' làm chỉ mục – joris

Bạn chỉ cần gọi sum trên một đối tượng groupby:

df.groupby('integer_id').sum()

Xem docs để biết thêm ví dụ

Nguồn

2014-08-27 20:42:57 EdChum

dịch vụ chăm sóc người điều hành để giải thích? – EdChum

Bạn có thể làm điều đó

data.groupby(by=['account_ID'])['purchases'].sum()

Nguồn

2015-06-26 09:42:58

Nhóm gấu trúc theo và tổng hai cột

Trả lời

Các vấn đề liên quan