cublas

15Nhiệt

2Trả lời

Hạt nhân CUDA có thể gọi hàm cublas không?

Tôi biết nó có vẻ kỳ lạ, nhưng đây là kịch bản của tôi: Tôi cần thực hiện phép nhân ma trận (A (n * k) * B (k * n)), nhưng tôi chỉ cần các phần tử chéo được đánh giá cho ma trận đầu ra. Tôi đã tìm kiế

9Nhiệt

1Trả lời

Làm thế nào để chuyển đổi ma trận một cách tối ưu bằng cách sử dụng blas?

Tôi đang thực hiện một số tính toán và thực hiện một số phân tích về các lực lượng và điểm yếu của các triển khai BLAS khác nhau. tuy nhiên tôi đã gặp một vấn đề. Tôi đang thử nghiệm cuBlas, làm linAl

6Nhiệt

3Trả lời

BLAS và CUBLAS

Tôi tự hỏi về Thư viện cuBLAS của NVIDIA. Có ai có kinh nghiệm với nó không? Ví dụ: nếu tôi viết chương trình C bằng BLAS, tôi có thể thay thế cuộc gọi đến BLAS bằng các cuộc gọi đến cuBLAS không? Hoặ

5Nhiệt

3Trả lời

Làm nhiều phép nhân ma trận-ma trận trong một hoạt động

Tôi đang thực hiện một thuật toán đó, về bản chất, là một loạt các phép nhân ma trận ma trận như thế này: Res = M1.M2.M3. ... .Mn ma trận của tôi là nổi 100x100 thực sự nhỏ, nhưng trình tự thực sự

12Nhiệt

1Trả lời

Làm rõ kích thước hàng đầu trong CUBLAS khi transposing

Đối với một ma trận A, các documentation chỉ khẳng định rằng các thông số kích thước tương ứng hàng đầu lda đề cập đến: kích thước của mảng hai chiều sử dụng để lưu trữ ma trận hàng đầu A Vì vậy, tôi

18Nhiệt

1Trả lời

ma trận bậc C phi vuông trong cuBLAS (numba)

Tôi đang cố gắng sử dụng các hàm cuBLAS trong gói Numba của Anaconda và gặp sự cố. Tôi cần các ma trận đầu vào theo thứ tự C. Đầu ra có thể theo thứ tự Fortran. Tôi có thể chạy tập lệnh mẫu được cung

7Nhiệt

1Trả lời

cublasSetVector() vs cudaMemcpy()

tôi tự hỏi nếu có một sự khác biệt giữa: // cumalloc.c - Create a device on the device HOST float * cudamath_vector(const float * h_vector, const int m) { float *d_vector = NULL; cudaError