Tăng tốc một vòng lặp cứng nhắc trong python?

Xét đoạn mã sau sử dụng mảng NumPy đó là rất chậm:Tăng tốc một vòng lặp cứng nhắc trong python?

# Intersection of an octree and a trajectory 
def intersection(octree, trajectory): 
    # Initialize numpy arrays 
    ox = octree.get("x") 
    oy = octree.get("y") 
    oz = octree.get("z") 
    oe = octree.get("extent")/2 
    tx = trajectory.get("x") 
    ty = trajectory.get("y") 
    tz = trajectory.get("z") 
    result = np.zeros(np.size(ox)) 
    # Loop over elements 
    for i in range(0, np.size(tx)): 
     for j in range(0, np.size(ox)): 
      if (tx[i] > ox[j]-oe[j] and 
       tx[i] < ox[j]+oe[j] and 
       ty[i] > oy[j]-oe[j] and 
       ty[i] < oy[j]+oe[j] and 
       tz[i] > oz[j]-oe[j] and 
       tz[i] < oz[j]+oe[j]): 
       result[j] += 1 
    # Finalize 
    return result

Làm thế nào để viết lại các chức năng để tăng tốc độ tính toán? (np.size(tx) == 10000 và np.size(ox) == 100000)

Nguồn

2014-06-05 Vincent

Bạn cũng cân nhắc sử dụng OpenCL? –

Tôi không cần hiệu suất đầy đủ, tôi chỉ muốn tăng tốc độ thô. – Vincent

Tạo một 'scipy.spatial.KDTree' từ các điểm tx, ty, tz và sau đó sử dụng tìm kiếm gần nhất trong tiêu chuẩn vô cực cho mỗi điểm trong ox, oy, oz để xem liệu có điểm nào đủ gần không. –

Bạn phân bổ 10.000 danh sách kích thước 100000. Điều đầu tiên cần làm là nên ngừng sử dụng range cho j vòng lặp lồng nhau và sử dụng phiên bản phát xrange để thay thế. Điều này sẽ giúp bạn tiết kiệm thời gian và không gian phân bổ tất cả các danh sách đó.

Người tiếp theo sẽ được sử dụng hoạt động vectorized:

for i in xrange(0, np.size(tx)): 
    index = (ox-oe < tx[i]) & (ox+oe > tx[i]) & (oy-oe < ty[i]) & (oy+oe > ty[i]) & (oz-oe < tz[i]) & (oz+oe > tz[i]) 
    result[index] += 1

Nguồn

2014-06-05 23:18:16

Thay đổi xong, nhưng nó không cung cấp một tốc độ lớn lên – Vincent

Hãy cho tôi một giây, có cái tiếp theo tới :) –

Ok, dạng véc tơ là trong (có thể cần kiểm tra các điều kiện), nhưng khi bạn sửa đổi câu hỏi của bạn để trả lời câu trả lời ban đầu của tôi là một phần của câu trả lời không liên quan mặc dù nó vẫn là bước khởi đầu tốt để làm trong trường hợp dữ liệu không gập ghềnh :) –

Bạn đang có khả năng để có được kết quả tốt bằng cách chạy mã này dưới PyPy: http://pypy.org/ (hướng dẫn tích hợp NumPy của chúng tôi tại https://bitbucket.org/pypy/numpy)

Nguồn

2014-06-05 23:26:35

Tôi nghĩ rằng điều này sẽ cho kết quả tương tự cho vòng lặp kép và nhanh hơn:

for j in xrange(np.size(ox)): 
    result[j] += sum(abs(tx-ox[j])<oe[j] & abs(ty-oy[j])<oe[j] & abs(tz-oz[j])<oe[j])

Để nhận được điều này: 1) sắp xếp lại các vòng lặp (ví dụ, hoán đổi t hem) hợp lệ vì không có gì thay đổi trong vòng lặp; 2) kéo result[j] bên ngoài vòng lặp i; 3) chuyển đổi tất cả các t>ox-oe and t<ox+oe thành abs(t-ox)<oe (mặc dù điều này có thể không phải là một tăng tốc lớn, nhưng nó dễ đọc hơn).

Vì bạn không có mã runnable, và tôi không muốn xây dựng một thử nghiệm cho điều này, tôi không chắc chắn 100% này là chính xác.

Nguồn

2014-06-06 04:39:34 tom10

Tăng tốc một vòng lặp cứng nhắc trong python?

Trả lời

Các vấn đề liên quan