Tôi đang nhầm lẫn về số lượng chủ đề tối đa có thể được khởi chạy trong GPU Fermi.Số lượng chủ đề tối đa có thể được khởi tạo trong một hạt nhân CUDA đơn lẻ
Truy vấn thiết bị GTX 570 của tôi cho biết như sau.
Maximum number of threads per block: 1024
Maximum sizes of each dimension of a block: 1024 x 1024 x 64
Maximum sizes of each dimension of a grid: 65535 x 65535 x 65535
Từ sự hiểu biết của tôi, tôi hiểu được những tuyên bố trên như:
Đối với một hạt nhân CUDA chúng ta có thể khởi động ở hầu hết 65.536 khối. Mỗi khối được khởi chạy có thể chứa tối đa 1024 luồng. Do đó về nguyên tắc, tôi có thể khởi động lên đến 65536 * 1024 (= 67108864) chủ đề.
Điều này có đúng không? Nếu chủ đề của tôi sử dụng sổ đăng ký nhiều thì sao? Liệu chúng ta vẫn có thể đạt được tối đa lý thuyết này về số lượng các chủ đề?
Sau khi viết và khởi chạy hạt nhân CUDA, làm cách nào để biết số lượng chuỗi và chuỗi mà tôi đã khởi chạy có thực sự được khởi tạo. Tôi có nghĩa là tôi không muốn GPU để tính toán một số rác, hoặc cư xử kỳ lạ, nếu tôi có cơ hội instantiated đề nhiều hơn là có thể cho rằng hạt nhân cụ thể.
Điều này có thể giúp bạn: http://stackoverflow.com/questions/2392250/understanding-cuda-grid-dimensions-block-dimensions-and-threads-organization-s – user1154664