Tốc độ dữ liệu của các hoạt động cudaMemcpy
bị ảnh hưởng nhiều bởi số làn PCI-e 3.0 (hoặc 2.0) được phân bổ để chạy từ CPU đến GPU. Tôi tò mò về cách các làn PCI-e được sử dụng trên các thiết bị Nvidia có chứa hai GPU.Phân bổ làn PCI-e trên thẻ 2 GPU?
Nvidia có một vài sản phẩm có hai GPU trên một thiết bị PCI-e. Ví dụ:
- GTX 590 chứa hai Fermi GF110 GPU
- GTX 690 chứa hai Kepler GK104 GPU
Như với nhiều card đồ họa mới, các thiết bị gắn trong PCI-e 16
khe. Đối với thẻ chỉ chứa một GPU, GPU có thể sử dụng 16 làn PCI-e.
Nếu tôi có một thiết bị có chứa hai GPU (như GTX 690), nhưng tôi chỉ chạy các công việc tính toán trên chỉ là một của GPU, có thể tất cả các làn đường 16 PCI-e phục vụ một GPU mà đang được sử dụng?
Để hiển thị này là nghệ thuật ascii ...
[ GTX690 (2x GF110) ] ------ 16 làn PCI-e ----- [ CPU ]
tôi không nói về trường hợp trong đó CPU được kết nối với hai thẻ có một GPU. (Như biểu đồ dưới đây)
[ GTX670 (1x GK104) ] ------ PCI-e làn ----- [ CPU ] ------ PCI làn -e ----- [ GTX670 (1x GK104) ]