2015-09-10 14 views
16

Tôi đang cố gắng chạy caffe trên Linux Ubuntu. Sau khi cài đặt, tôi chạy caffe bằng gpu và lỗi làKhông thể chèn 'nvidia_352': Không có thiết bị nào như vậy

I0910 13:28:13.606891 10629 caffe.cpp:296] Use GPU with device ID 0 
modprobe: ERROR: could not insert 'nvidia_352': No such device 
F0910 13:28:13.728612 10629 common.cpp:142] Check failed: error == cudaSuccess (38 vs. 0) no CUDA-capable device is detected 
*** Check failure stack trace: *** 
    @  0x7ffd3b9a7daa (unknown) 
    @  0x7ffd3b9a7ce4 (unknown) 
    @  0x7ffd3b9a76e6 (unknown) 
    @  0x7ffd3b9aa687 (unknown) 
    @  0x7ffd3bf91cb5 caffe::Caffe::SetDevice() 
    @   0x40a5a7 time() 
    @   0x4080f8 main 
    @  0x7ffd3aeb9ec5 (unknown) 
    @   0x408618 (unknown) 
    @    (nil) (unknown) 
Aborted (core dumped) 

Trình điều khiển NVIDIA của tôi là 352,41. Tôi đã cài đặt 352 và được cài đặt phiên bản mới nhất.

sudo apt-get install nvidia-352[sudo] 
Reading package lists... Done 
Building dependency tree  
Reading state information... Done 
nvidia-352 is already the newest version. 
The following packages were automatically installed and are no longer required: 
    account-plugin-windows-live libupstart1 
Use 'apt-get autoremove' to remove them. 
0 upgraded, 0 newly installed, 0 to remove and 31 not upgraded. 

Ubuntu của tôi có NVIDIA lái xe 352 và tại sao tôi có lỗi như

I0910 13:28:13.606891 10629 caffe.cpp:296] Use GPU with device ID 0 
    modprobe: ERROR: could not insert 'nvidia_352': No such device 
    F0910 13:28:13.728612 10629 common.cpp:142] Check failed: error == cudaSuccess (38 vs. 0) no CUDA-capable device is detected 

tôi kiểm tra xem tôi có CUDA thiết bị có khả năng như

lspci | grep -i nvidia 
05:00.0 VGA compatible controller: NVIDIA Corporation GK107GL [Quadro K2000] (rev a1) 
05:00.1 Audio device: NVIDIA Corporation GK107 HDMI Audio Controller (rev a1) 

Tôi có CUDA thiết bị có khả năng và lý do tại sao tôi nhận được lỗi?

CHỈNH SỬA 1: Vâng thử nghiệm của tôi với ./deviceTruy cập không thành công.

../NVIDIA_CUDA-7.5_Samples/bin/x86_64/linux/release/deviceQuery Starting... 

CUDA Device Query (Runtime API) version (CUDART static linking) 

cudaGetDeviceCount returned 38 
-> no CUDA-capable device is detected 
Result = FAIL 

Tôi đã kiểm tra thư mục/dev, tôi có nvidia0.

crwxrwxrwx 1 root root 195, 0 Sep 10 16:51 nvidia0 
crw-rw-rw- 1 root root 195, 255 Sep 10 16:51 nvidiactl 

séc -V nvcc tôi đã cho tôi

[email protected]:/dev$ nvcc -V 
nvcc: NVIDIA (R) Cuda compiler driver 
Copyright (c) 2005-2015 NVIDIA Corporation 
Built on Tue_Aug_11_14:27:32_CDT_2015 
Cuda compilation tools, release 7.5, V7.5.17 

Sau đó kiểm tra phiên bản của tôi

[email protected]:/dev$ cat /proc/driver/nvidia/version 
NVRM version: NVIDIA UNIX x86_64 Kernel Module 352.41 Fri Aug 21 23:09:52 PDT 2015 
GCC version: gcc version 4.8.4 (Ubuntu 4.8.4-2ubuntu1~14.04) 

Điều gì có thể xảy ra?

+1

Bỏ qua một bên caffeine một lúc, bạn có chắc chắn rằng bản cài đặt CUDA cơ bản của bạn hoạt động chính xác không? – talonmies

+1

Tất nhiên, tôi đã cài đặt CUDA7.5. Tất cả các tiêu đề lib và tiêu đề được cài đặt trong /usr/local/cuda7.5. Tất cả đường dẫn được xuất ra khi xuất PATH =/usr/local/cuda-7.5/bin: $ PATH $ xuất LD_LIBRARY_PATH =/usr/local/cuda-7.5/lib64: $ LD_LIBRARY_PATH. Tôi đã cài đặt thành công caffe. – batuman

+2

Đó không phải là những gì tôi hỏi. Bạn có thể biên dịch và chạy thành công một ứng dụng CUDA đơn giản, giống như một trong các mẫu từ bộ công cụ CUDA? – talonmies

Trả lời

11

Bây giờ vấn đề được giải quyết. Tôi đã kiểm tra sudo dpkg --list | grep nvidia Tôi tìm thấy là hạt nhân của tôi có 352,41, nhưng khách hàng có 304,12. Vì vậy, tôi đã làm sudo apt-get remove --purge nvidia-*. Nó đã xóa tất cả các gói. Sau đó, cài đặt 352,41 như

$ sudo add-apt-repository ppa:xorg-edgers/ppa -y 
$ sudo apt-get update 
$ sudo apt-get install nvidia-352 

Sau đó

$ sudo dpkg --list | grep nvidia 
rc nvidia-304 304.128-0ubuntu0~gpu14.04.2 amd64 NVIDIA legacy binary driver - version 304.128 
rc nvidia-304-updates 304.125-0ubuntu0.0.2 amd64 NVIDIA legacy binary driver - version 304.125 
ii nvidia-352 352.41-0ubuntu0~gpu14.04.1 amd64 NVIDIA binary driver - version 352.41 
rc nvidia-opencl-icd-304 304.128-0ubuntu0~gpu14.04.2 amd64 NVIDIA OpenCL ICD 
rc nvidia-opencl-icd-304-updates 304.125-0ubuntu0.0.2 amd64 NVIDIA OpenCL ICD 
ii nvidia-opencl-icd-352 352.41-0ubuntu0~gpu14.04.1 amd64 NVIDIA OpenCL ICD 
ii nvidia-prime 0.6.2 amd64 Tools to enable NVIDIA's Prime 
ii nvidia-settings 355.11-0ubuntu0~gpu14.04.1 amd64 Tool for configuring the NVIDIA graphics driver 

Bây giờ trận đấu phiên bản. Sau đó, //eviceQuery và tất cả công việc như mong đợi. Cảm ơn

+0

http://askubuntu.com/questions/723632/nvidia-7300-le-driver-15-10-how-to-install-ubuntu-modprobe-error-could-not Tôi không biết nếu nó "cố định". –

2

Tôi cũng gặp sự cố này. Và việc cài đặt lại trình điều khiển nvidia không giải quyết được vấn đề.

Cuối cùng, tôi giải quyết vấn đề này bằng cách thêm hai tham số hạt nhân với grub.

thêm vào:

GRUB_CMDLINE_LINUX_DEFAULT 

với:

pci=nocrs pci=realloc 

Tôi nghĩ rằng đây là một vụ va chạm giữa cuda7.5kernel3.19.

+0

Cũng trên [https://devtalk.nvidia.com/default/topic/838768/problems-with-geforce-gtx-980-on-asustek-g20aj/] diễn đàn nvidia! – Heartinpiece

+0

thêm 'pci = nocrs pci = realloc' vào '/ etc/default/grub' rồi' # update-grub' – Heartinpiece

+0

GeForce 7 Series 7300 LE: '$ lspci -vnn | grep -i VGA -A 12> Trình điều khiển hạt nhân đang sử dụng: nvidia'. Tốt. Tuy nhiên, đăng nhập GUI startx' và ubuntu-desktop vẫn dẫn đến màn hình không có Unity. : < –

-1

Tôi cũng gặp sự cố này. Các câu trả lời trên không hiệu quả với tôi. Khi tôi cài đặt trình điều khiển mới nhất (nvidia-364), nó hoạt động.Lệnh để chạy:

sudo add-apt-repository ppa:xorg-edgers/ppa 
sudo apt-get update 
sudo apt-get install nvidia-364 

Tôi nghĩ vấn đề xảy ra khi chúng tôi có phiên bản khác của gcc sử dụng để biên dịch các module điều khiển và hạt nhân Linux.

Các vấn đề liên quan