Tôi đang cố gắng để hồ sơ ứng dụng OpenCL, a.out
, trong một hệ thống với NVIDIA TITAN X và CUDA 8.0.Cách để hồ sơ ứng dụng OpenCL với CUDA 8.0 nvprof
Nếu đó là ứng dụng CUDA, nvprof ./a.out
sẽ là đủ. Nhưng tôi thấy điều này không hoạt động với ứng dụng OpenCL, với một thông báo "Không có hạt nhân nào được lược tả."
Cho đến khi CUDA 7.5, tôi đã sử dụng thành công COMPUTE_PROFILE=1
sau this. Thật không may, tài liệu nói rằng "Hỗ trợ cho trình biên dịch dòng lệnh bằng biến môi trường COMPUTE_PROFILE đã bị loại bỏ trong bản phát hành CUDA 8.0."
Câu hỏi đặt ra là có cách nào khác ngoài việc hạ cấp CUDA xuống hồ sơ ứng dụng OpenCL với nvprof không?
Bạn có đang gọi 'clReleaseContext 'trong ứng dụng của mình không? – talonmies
@talonmies Có, nó gọi đúng chức năng phát hành cho ngữ cảnh, hàng đợi, chương trình, hạt nhân và đối tượng bộ nhớ. – csehydrogen