Tôi đang thực hiện một số tính toán và thực hiện một số phân tích về các lực lượng và điểm yếu của các triển khai BLAS khác nhau. tuy nhiên tôi đã gặp một vấn đề.Làm thế nào để chuyển đổi ma trận một cách tối ưu bằng cách sử dụng blas?
Tôi đang thử nghiệm cuBlas, làm linAlg trên GPU có vẻ như là một ý tưởng hay, nhưng có một vấn đề.
Việc triển khai cuBlas sử dụng định dạng cột chính và vì đây không phải là thứ tôi cần cuối cùng, tôi tò mò liệu có cách nào có thể làm cho BLAS chuyển đổi ma trận không?
".... và vì đây không phải là điều cuối cùng .....". Thiếu một vài từ? – talonmies
Bắt đầu từ CUDA 5.0, cuBLAS có 'cublas geam' là một thói quen rất hiệu quả để thực hiện chuyển vị ma trận. Để có mã đầy đủ thực hiện giải pháp này và so sánh hiệu suất với chuyển vị ma trận bằng Thrust, xem [Cách hiệu quả nhất để chuyển đổi ma trận trong CUDA là gì?] (Http://stackoverflow.com/questions/15458552/what-is- hiệu quả nhất-cách-to-transpose-a-ma trận-in-cuda/21803459 # 21803459). –
JackOLantern