Hướng dẫn lập trình CUDA khẳng định rằngÝ nghĩa của băng thông trong CUDA và lý do tại sao điều quan trọng là
"băng thông là một trong những yếu tố gating quan trọng nhất để thực hiện. Hầu như tất cả các thay đổi mã nên được thực hiện trong bối cảnh cách chúng ảnh hưởng đến băng thông. "
Nó tiếp tục tính toán băng thông lý thuyết theo thứ tự hàng trăm gigabyte trên giây. Tôi đang ở một mất mát là tại sao có bao nhiêu byte người ta có thể đọc/ghi vào bộ nhớ toàn cầu là một sự phản ánh của một hạt nhân được tối ưu hóa tốt như thế nào.
Nếu tôi có hạt nhân thực hiện tính toán chuyên sâu trên dữ liệu được lưu trữ trong bộ nhớ chia sẻ và/hoặc sổ đăng ký, chỉ đọc một lần khi bắt đầu và ghi ra từ đầu đến bộ nhớ toàn cục, chắc chắn băng thông hiệu quả sẽ là nhỏ, trong khi hạt nhân chính nó có thể rất hiệu quả.
Có thể giải thích thêm bất kỳ băng thông nào trong ngữ cảnh này không?
Cảm ơn