一、Failed to initialize NVML: Driver/library version mismatch
现象:
原因:
(资料图)
这个问题出现的原因是 kernel mod 的 Nvidia driver 的版本没有更新,一般情况下,重启机器就能够解决,如果因为某些原因不能够重启的话,也有办法 reload kernel mod。
解决方案:
1. 重新加载模块
2. 重装驱动
重新加载模块无效,重启无效,直接重装驱动发现系统显示驱动版本还是旧版
cat /proc/driver/nvidia/version
完全卸载驱动
二、ubuntu重启后显卡挂了:NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
现象:
原因:
由于内核版本与安装驱动时的版本不匹配造成的。
解决方案:
三、RuntimeError: CUDA unknown error - this may be due to an incorrectly set up environment
现象:
解决方案:
重新安装相同版本的显卡驱动,如果还有该错误信息,执行apt-get install nvidia-modprobe
/weixin_47156261/article/details/116717563
关键词: