输入nvidia-smi指令报错Failed to initialize NVML: Driver/library version mismatch的解决方法(不用重启电脑或服务器)
方法一:
可以试一下下面这写指令,重新加载 NVIDIA 模块
sudo rmmod nvidia_uvm
sudo rmmod nvidia_drm
sudo rmmod nvidia_modeset
sudo rmmod nvidia
sudo modprobe nvidia
sudo modprobe nvidia_modeset
sudo modprobe nvidia_drm
nvidia-smi
再次运行 nvidia-smi
检查状态:运行成功!!!
方法二:
如果上面方法不行,可以试一下把下面链接方法试一下,删除那些进程
看nvidia模块使用情况
lsmod | grep nvidia
nvidia_uvm 647168 0
nvidia_drm 53248 0
nvidia_modeset 790528 1 nvidia_drm
nvidia 12144640 152 nvidia_modeset,nvidia_uvm 12144640 152 nvidia_modeset,nvidia_uvm
这就需要我们来手动地关闭nvidia_modset和nvidia_uvm服务。
查看所有的nvidia相关的进程
sudo lsof -n -w /dev/nvidia*
然后,我们通过kill -9 PID 终止掉和nvidia_uvm,nvidia_modeset有关的进程。然后再重新执行如下的指令
sudo rmmod nvidia
sudo nvidia-smi #nvidia-smi发现没有kernel mod的时候,会自动装载
最后,正常情况下问题就解决了。
如果还没有解决,通过如下指令终止nvidia的相关服务
sudo rmmod nvidia_uvm
sudo rmmod nvidia_drm
sudo rmmod nvidia_modeset
sudo rmmod nvidia
再执行
sudo rmmod nvidia
参考链接(亲测有效):【nvidia-smi】Failed to initialize NVML: Driver/library version mismatch解决方法(不用重启)_driver library version mismatch-CSDN博客