physics

    11Nhiệt

    3Trả lời

    Tôi đang chạy kernel OpenCL dưới đây với một kích thước làm việc toàn cầu hai chiều của 1000000 x 100 và kích thước làm việc tại địa phương trong tổng số 1 x 100. __kernel void myKernel( const in

    5Nhiệt

    2Trả lời

    Tôi có hạt nhân đơn giản: __kernel vecadd(__global const float *A, __global const float *B, __global float *C) { int idx = get_global_id(0); C[idx] = A[idx] + B[idx]; } T

    8Nhiệt

    2Trả lời

    Tôi đã triển khai một hạt nhân đơn giản, đó là một loại sắp xếp của một convolution. Tôi đo nó trên NVIDIA GT 240. Mất 70 ms khi viết trên CUDA và 100 ms khi được viết trên OpenCL. Ok, tôi nghĩ, trình

    10Nhiệt

    5Trả lời

    Tôi biết rằng các mục công việc được nhóm vào các nhóm làm việc và bạn không thể đồng bộ hóa bên ngoài một nhóm làm việc. Điều đó có nghĩa là các mục công việc được thực hiện song song? Nếu có, có thể

    24Nhiệt

    6Trả lời

    Đối với độc lập plattform (máy tính để bàn, điện toán đám mây, di động, ...) sẽ rất tuyệt vời khi sử dụng OpenCL để phát triển GPGPU khi tốc độ không thành vấn đề. Tôi biết Google đẩy RenderScript như

    6Nhiệt

    2Trả lời

    Bitfields không được hỗ trợ bằng ngôn ngữ OpenCL. Lý do để không hỗ trợ họ là gì? Không giống như các phần khác bị bỏ qua (đệ quy, con trỏ đến hàm, ...), ở đó có một lý do rõ ràng để không hỗ trợ chún

    6Nhiệt

    2Trả lời

    Tôi đang cố gắng hiểu kiến ​​trúc của các thiết bị OpenCL như GPU và tôi không thấy tại sao có giới hạn rõ ràng về số lượng mục công việc trong nhóm làm việc cục bộ, tức là hằng số CL_DEVICE_MAX_WORK_

    5Nhiệt

    2Trả lời

    Tôi đang lên kế hoạch mua một GPU nghiêm trọng để chạy thuật toán song song (ngân sách 2k-4k). Bây giờ tôi thấy ở mọi nơi các siêu máy tính có thẻ GPU nVidia Tesla "được làm đặc biệt cho GPGPU". Mặc d

    6Nhiệt

    1Trả lời

    Tôi muốn viết một chương trình cho GPU (tốt nhất là OpenCL) và một phần lớn của tính toán bao gồm đếm số lượng 1 trong một mảng bit (đóng gói là dài hoặc int). Vì vậy, trên các CPU hiện đại, tôi rõ rà

    11Nhiệt

    1Trả lời

    Hãy xem xét một ví dụ đơn giản: bổ sung vectơ. Nếu tôi xây dựng một chương trình cho CL_DEVICE_TYPE_GPU và tôi xây dựng chương trình tương tự cho CL_DEVICE_TYPE_CPU, sự khác biệt giữa chúng (ngoại trừ