NVIDIA-SMI ist fehlgeschlagen, da keine Kommunikation mit dem NVIDIA-Treiber möglich war. Stellen Sie sicher, dass der neueste NVIDIA-Treiber installiert ist und ausgeführt wird

21

Ich habe gerade CUDA in einem Notebook wie diesem installiert:

sudo apt-get install cuda

Wie hier gesagt .

Die Kompilierung funktioniert einwandfrei, aber wenn ich versuche, sie auszuführen, tritt das folgende Problem auf: CUDA-Fehler bei file.cu:128 code = 35 (cudaErrorInsufficientDriver) "cudaStreamCreate (& (stream [i]))"

Meine NVCC-Version:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Tue_Jan_10_13:22:03_CST_2017
Cuda compilation tools, release 8.0, V8.0.61

Grafikkarteninfo:

lspci | egrep 'VGA|3D'
00:02.0 VGA compatible controller: Intel Corporation Skylake Integrated Graphics (rev 06)
02:00.0 3D controller: NVIDIA Corporation GM107M [GeForce GTX 960M] (rev a2)

Ich habe auch VirtualGL, bumblebee-nvidia, primus, freeglut3-dev installiert. Im Anschluss daran .

Wenn ich versuche, etwas auf Hummel laufen zu lassen, habe ich folgendes: optirun glxspheres64

[   41.413478] [ERROR]Cannot access secondary GPU - error: Could not load GPU driver
[   41.413520] [ERROR]Aborting because fallback start is disabled.

NVIDIA-Treiber funktioniert nicht.

nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

Es sieht so aus, als ob die NVIDIA 375-Version installiert ist, aber ich kann es nicht zum Laufen bringen.

whereis nvidia
nvidia: /usr/lib/nvidia /usr/share/nvidia /usr/src/nvidia-375-375.66/nvidia

Und einige Fahrerinformationen.

modinfo nvidia_375
filename:       /lib/modules/4.8.0-54-generic/updates/dkms/nvidia_375.ko
alias:          char-major-195-*
version:        375.66
supported:      external
license:        NVIDIA
srcversion:     68751AFD79A210CEFFB8758
alias:          pci:v000010DEd00000E00sv*sd*bc04sc80i00*
alias:          pci:v000010DEd*sv*sd*bc03sc02i00*
alias:          pci:v000010DEd*sv*sd*bc03sc00i00*
depends:        
vermagic:       4.8.0-54-generic SMP mod_unload modversions 
parm:           NVreg_Mobile:int
parm:           NVreg_ResmanDebugLevel:int
parm:           NVreg_RmLogonRC:int
parm:           NVreg_ModifyDeviceFiles:int
parm:           NVreg_DeviceFileUID:int
parm:           NVreg_DeviceFileGID:int
parm:           NVreg_DeviceFileMode:int
parm:           NVreg_UpdateMemoryTypes:int
parm:           NVreg_InitializeSystemMemoryAllocations:int
parm:           NVreg_UsePageAttributeTable:int
parm:           NVreg_MapRegistersEarly:int
parm:           NVreg_RegisterForACPIEvents:int
parm:           NVreg_CheckPCIConfigSpace:int
parm:           NVreg_EnablePCIeGen3:int
parm:           NVreg_EnableMSI:int
parm:           NVreg_TCEBypassMode:int
parm:           NVreg_UseThreadedInterrupts:int
parm:           NVreg_MemoryPoolSize:int
parm:           NVreg_RegistryDwords:charp
parm:           NVreg_RmMsg:charp
parm:           NVreg_AssignGpus:charp

Ich denke, es kann ein Problem mit der Treiberversion sein:

dpkg -l | grep nvidia
ii  bumblebee-nvidia                            3.2.1-10                                      amd64        NVIDIA Optimus support using the proprietary NVIDIA driver
ii  nvidia-375                                  375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary driver - version 375.66
ii  nvidia-375-dev                              375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary Xorg driver development files
ii  nvidia-modprobe                             375.51-0ubuntu1                               amd64        Load the NVIDIA kernel driver and create device files
ii  nvidia-opencl-icd-375                       375.66-0ubuntu0.16.04.1                       amd64        NVIDIA OpenCL ICD
ii  nvidia-prime                                0.8.2                                         amd64        Tools to enable NVIDIA's Prime

Was vermisse ich?

Rodolfo
quelle
Wie installiere ich Treiber?
Charlie Parker
Konnte den gleichen Fehler und keine der Antworten funktionierte. Was funktionierte, war einfach : $ reboot now.
Darthbhyrava

Antworten:

13

Wenn Sie nvidia-sminicht kommunizieren konnten, den Treiber jedoch so oft installiert haben, überprüfen Sie dies prime-select.

  1. Führen Sie aus prime-select query, um alle möglichen Optionen zu erhalten. Sie sollten zumindest sehen nvidia | intel.
  2. Wählen Sie prime-select nvidia.
  3. Wenn es heißt nvidia is already selected, wählen Sie ein anderes aus, z. B. prime-select intelwechseln Sie zurück zu nvidiaprime-select nvidia
  4. Starten Sie neu und überprüfen Sie nvidia-smi.
Phuc Le
quelle
Half mir. Vielen Dank!
Jaroslaw Schubert
Oh, prime-select queryich habe nicht einmal
Informationen aufgelistet
10

Möglicherweise möchten Sie das cuda Toolkit installieren. Verwenden Sie den folgenden Befehl, um es zu installieren.

sudo apt install nvidia-cuda-toolkit

Starten Sie den Computer nach Abschluss der Installation neu. nvidia-smisollte arbeiten.

Jack Chan
quelle
funktioniert bei mir !!
x0v
Das funktioniert bei mir
Sundeep
5
Es hat hier nicht funktioniert
Bill Kotsias
1
Tun Sie dies nicht, wenn Sie cuda> = 10 haben. Dadurch wird Ihr cuda auf 9 herabgestuft, das derzeit auf Ubuntu ohne CUDA PPA verfügbar ist.
Loretoparisi
Zuvor sudo apt-get purge nvidia-*hat die obige Zeile alles behoben, was CUDA für mich
Dinari
5

Ich habe den Secure Boot deaktiviert und es hat ganz gut funktioniert.

@ rod-smith stellte eine weitere Frage, die genauer erklärt, wie es geht. Im Grunde ist es eine Setup-Konfiguration, aber er schreibt auch einen guten Artikel darüber, wie man das hier macht .

Rodolfo
quelle
2
Es hat mir auch mit nvidia driver 390 geholfen! Ich hätte nie gedacht, dass es an einem sicheren Boot liegen könnte, danke :)
Samutamm
Der UEFI-Modus mit deaktiviertem Secure Boot ist hier bereits ausgeführt. =) Sieht so aus, als ob es leider nicht für alle funktioniert.
Renan Willian Prado
3

Da ich die Antwort von @ Rodolfo oben nicht kommentieren kann (nicht genügend Ruf), füge ich eine neue Antwort hinzu.

Auf meinem Computer musste ich Secure Boot entsprechend meinem Betriebssystem konfigurieren . Ich habe ein ASUS-Mainboard mit Ubuntu 18.04 und habe versucht, NVIDIA CUDA 10.1 Update 2 mit dem gepackten NVIDIA-Treiber zu installieren. Ich hatte das gleiche Problem wie oben beschrieben. Wie sich herausstellte, wurde Secure Boot auf den Windows-UEFI-Modus eingestellt. Das Ändern auf ein anderes Betriebssystem hat es für mich behoben.

Markus
quelle
Danke, ich musste deaktivieren, Secure Bootwas während eines Windows / BIOS-Auto-Updates automatisch wieder aktiviert wurde !!! Jetzt funktioniert NVIDIA gut.
Bill Kotsias
Würde es Ihnen etwas ausmachen zu erklären, wie Sie den sicheren Start auf ein anderes Betriebssystem geändert haben ?
Inspi
1

Für zukünftige Leser:

Ich bin auf einer Instanz einer virtuellen Maschine (Google Cloud Platform).

und ich folge diesem Kern , um Cudaund CuDNnauf meiner VM zu installieren .

Ich musste das CuDNnTeil manuell hochladen . (Stell es einfach da raus.)

Kommen wir nun zum Fehler:

Ich hatte dieses Problem, aber ein vollständiger Neustart der Instanz hat den Job erledigt. Und mit vollständigem Neustart meine ich, die Instanz anzuhalten und wieder einzuschalten.

Ich hoffe das hilft jemandem.

Pramesh Bajracharya
quelle