Trong một số mã, chúng ta cần lấy các véc tơ tự động và các giá trị tự động cho vấn đề tổng quát riêng với các ma trận đối xứng thực (Ax = lamba Bx). Mã này sử dụng DSPGVX từ LACPACK. Chúng tôi muốn tăng tốc độ lên GPU bằng chức năng MAGMA. Chúng tôi đã hỏi trên diễn đàn này và nhận được câu trả lời về vấn đề nàyHiệu năng kém để tính toán các giá trị riêng và các giá trị riêng trên GPU
http://icl.cs.utk.edu/magma/docs/zhegvx_8cpp.html
Kích thước của ma trận của chúng tôi (N) đi 100-50.000 và thậm chí nhiều hơn, liên quan đến số nguyên tử trong một phân tử. Chúng tôi quan sát:
a) cho N lớn hơn 2500 (xấp xỉ), MAGMA không hoạt động; lỗi phân đoạn b) MAGMA chạy luôn chậm hơn LAPACK tuần tự, khoảng 10 lần chậm hơn
Hành vi này có bình thường và chúng ta có thể vượt qua nó không? Ai có thể báo cáo bất kỳ tài liệu tham khảo, nơi bất cứ ai làm việc trên các vấn đề tương tự này được một tốc độ phong nha?
Cảm ơn
Ý của bạn là "không hoạt động" ... nó có chạy không? Liệu nó tạo ra kết quả sai, nó có bị hỏng và ghi vào thời gian chạy không? – prelic
Bạn đang chạy GPU gì? – talonmies
Tesla c2070 với ram 4gb – flow