cublas

    15Nhiệt

    2Trả lời

    Tôi biết nó có vẻ kỳ lạ, nhưng đây là kịch bản của tôi: Tôi cần thực hiện phép nhân ma trận (A (n * k) * B (k * n)), nhưng tôi chỉ cần các phần tử chéo được đánh giá cho ma trận đầu ra. Tôi đã tìm kiế

    9Nhiệt

    1Trả lời

    Tôi đang thực hiện một số tính toán và thực hiện một số phân tích về các lực lượng và điểm yếu của các triển khai BLAS khác nhau. tuy nhiên tôi đã gặp một vấn đề. Tôi đang thử nghiệm cuBlas, làm linAl

    6Nhiệt

    3Trả lời

    Tôi tự hỏi về Thư viện cuBLAS của NVIDIA. Có ai có kinh nghiệm với nó không? Ví dụ: nếu tôi viết chương trình C bằng BLAS, tôi có thể thay thế cuộc gọi đến BLAS bằng các cuộc gọi đến cuBLAS không? Hoặ

    5Nhiệt

    3Trả lời

    Tôi đang thực hiện một thuật toán đó, về bản chất, là một loạt các phép nhân ma trận ma trận như thế này: Res = M1.M2.M3. ... .Mn ma trận của tôi là nổi 100x100 thực sự nhỏ, nhưng trình tự thực sự

    12Nhiệt

    1Trả lời

    Đối với một ma trận A, các documentation chỉ khẳng định rằng các thông số kích thước tương ứng hàng đầu lda đề cập đến: kích thước của mảng hai chiều sử dụng để lưu trữ ma trận hàng đầu A Vì vậy, tôi

    18Nhiệt

    1Trả lời

    Tôi đang cố gắng sử dụng các hàm cuBLAS trong gói Numba của Anaconda và gặp sự cố. Tôi cần các ma trận đầu vào theo thứ tự C. Đầu ra có thể theo thứ tự Fortran. Tôi có thể chạy tập lệnh mẫu được cung

    7Nhiệt

    1Trả lời

    tôi tự hỏi nếu có một sự khác biệt giữa: // cumalloc.c - Create a device on the device HOST float * cudamath_vector(const float * h_vector, const int m) { float *d_vector = NULL; cudaError