Tôi có một dataframe pandas
với một số hàng gần trùng lặp nhau, ngoại trừ một giá trị. Mục tiêu của tôi là hợp nhất hoặc "hợp nhất" các hàng này thành một hàng duy nhất, mà không tính tổng các giá trị bằng số.gấu trúc - Hợp nhất các hàng gần giống nhau dựa trên giá trị cột
Dưới đây là một ví dụ về những gì tôi đang làm việc với:
Name Sid Use_Case Revenue
A xx01 Voice $10.00
A xx01 SMS $10.00
B xx02 Voice $5.00
C xx03 Voice $15.00
C xx03 SMS $15.00
C xx03 Video $15.00
Và đây là những gì tôi muốn:
Name Sid Use_Case Revenue
A xx01 Voice, SMS $10.00
B xx02 Voice $5.00
C xx03 Voice, SMS, Video $15.00
Lý do tôi không muốn tính tổng "Doanh thu "là vì bảng của tôi là kết quả của việc thực hiện xoay vòng trong một số khoảng thời gian mà" Doanh thu "chỉ đơn giản là kết thúc việc liệt kê nhiều lần thay vì có giá trị khác cho mỗi" Use_Case ".
Cách tốt nhất để giải quyết vấn đề này là gì? Tôi đã xem xét chức năng groupby()
nhưng tôi vẫn không hiểu nó rất tốt.
Nếu câu trả lời của tôi hoặc Ami là hữu ích, đừng quên [chấp nhận] (http://meta.stackexchange.com/questions/5234/how-does-accepting-an-answer-work) nó. Cảm ơn. – jezrael
Cảm ơn bạn! Cả hai đều hoạt động tốt. Tôi có thể phải hợp nhất một vài cột như tập dữ liệu thực tế của tôi là rộng hơn nhiều so với 4 tôi cung cấp, nhưng điều đó nên làm các trick –