Tôi có hai mảng kết xuất 2D (được đơn giản hóa trong ví dụ này về kích thước và nội dung) với kích thước giống nhau. ma trậnTổng hợp dữ liệu từ mảng dựa trên mảng khác trong Numpy
Một ID:
1 1 1 2 2
1 1 2 2 5
1 1 2 5 5
1 2 2 5 5
2 2 5 5 5
và một ma trận giá trị:
14.8 17.0 74.3 40.3 90.2
25.2 75.9 5.6 40.0 33.7
78.9 39.3 11.3 63.6 56.7
11.4 75.7 78.4 88.7 58.6
79.6 32.3 35.3 52.5 13.3
Mục tiêu của tôi là để đếm và tổng các giá trị từ các ma trận thứ hai được phân nhóm theo các ID từ ma trận đầu tiên:
1: (8, 336.8)
2: (9, 453.4)
5: (8, 402.4)
Tôi có thể làm điều này trong một vòng lặp for
nhưng khi ma trận có kích thước bằng hàng nghìn thay vì chỉ 5x5 và hàng nghìn ID duy nhất, phải mất rất nhiều thời gian để xử lý.
Có numpy
có phương pháp thông minh hoặc kết hợp các phương pháp để thực hiện việc này không?
Đẹp nhất! Tôi không biết các đối số 'return_ *' cho 'np.unique'. – kazemakase
@Divakar: Cảm ơn bạn! Đây chính xác là loại giải pháp mà tôi đang tìm kiếm với một hiệu suất tốt do sự vectơ hóa. – Chau