运维打铁:Linux Centos 7 安装更新GPU driver驱动和cuda
文章目录
- 一、查看显卡版本命令
- 二、更新驱动
- 2.1 下载显卡驱动
- 2.2 安装前配置
- 2.3 安装显卡驱动
- 三、下载更换cuda版本
- 3.1 下载cuda
- 3.2 安装过程选项处理
- 3.3 配置环境变量

一、查看显卡版本命令
- 查看GPU驱动版本及支持的最高cuda版本
- 命令:
nvidia-smi
- 作用:显示GPU驱动版本和driverAPI(支持的最高cuda版本)。
- 命令:
- 动态监控显卡状态
- 命令:
watch -n 1 nvidia-smi
- 作用:每隔1秒动态监控显卡状态。
- 命令:
- 查看cuda版本及运行时API
- 命令:
nvcc -V
- 作用:显示cuda版本和timeAPI(运行时API)。
- 命令:
二、更新驱动
2.1 下载显卡驱动
-
查看显卡信息
- 命令:
lspci | grep -i nvidia
- 作用:查看自己的显卡信息。
- 命令:
-
下载驱动
- 登录NVIDIA官方网站(官方驱动 | NVIDIA),根据自己的显卡信息选择适合的驱动型号和版本,保存为.run文件。
- 登录NVIDIA官方网站(官方驱动 | NVIDIA),根据自己的显卡信息选择适合的驱动型号和版本,保存为.run文件。
2.2 安装前配置
- 验证系统是否安装必要工具
- 验证命令:
gcc –v
g++ -v
- 安装命令:若未安装,使用
yum install gcc gcc-c++ tar make
进行安装。
- 验证命令:
- 安装kernel-header包
- 若未安装,使用
yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)
进行安装。
- 若未安装,使用
- 卸载已安装的驱动
- 命令:
sudo /usr/bin/nvidia-uninstall
- 注意:出现xconfig选择yes。
- 命令:
- 查询并禁用Nouveau模块
- 查询命令:
lsmod | grep nouveau
- 若有输出表示该模块正在运行,需要禁用。
- 禁用方法:
- 编辑文件
vim /usr/lib/modprobe.d/blacklist-nouveau.conf
,按I
进入插入模式,写入以下内容:
- 编辑文件
- 查询命令:
blacklist nouveau
options nouveau modeset=0
- 按`esc`退出插入模式,按`shift + :`,输入`wq`保存并退出文件。
- 使内核生效并重启服务器:
- `dracut -f`
- `systemctl set-default multi-user.target`
- `reboot`
- 再次查询:`lsmod | grep nouveau`,若无输出则禁用成功。
2.3 安装显卡驱动
-
上传驱动程序:将下载好的驱动程序(如
NVIDIA-Linux-x86_64-460.106.00.run
)上传至GPU节点(服务器)。 -
赋予执行权限并安装
- 命令:
sudo chmod a+x NVIDIA-Linux-x86_64-460.106.00.run
sudo ./NVIDIA-Linux-x86_64-460.106.00.run
- 命令:
-
安装过程处理
- 安装过程中若显示问题,选择
NO
继续。 - 若出现警告可忽略,直至安装完成。
- 安装过程中若显示问题,选择
-
验证安装结果:安装后输入
nvidia-smi
,若显示正常则安装成功。
三、下载更换cuda版本
3.1 下载cuda
到官网(CUDA Toolkit Archive | NVIDIA Developer)找到所需的cuda版本,选择对应主机(服务器)的下载安装命令。例如,安装CUDA - 11.1:
wget https://developer.download.nvidia.com/compute/cuda/11.1.1/local_installers/cuda_11.1.1_455.32.00_linux.run
sudo sh cuda_11.1.1_455.32.00_linux.run
3.2 安装过程选项处理
- 同意协议:选择
accept
。 - 不要勾选
driver
(按空格使[ ]
中没有X
)。 - 选择
YES
替换旧的软连接。
3.3 配置环境变量
在vi ~/.bashrc
文件末端加上配置信息,以下两种配置二选一:
- 当
/usr/local
中有cuda的软连接时:
export CUDA_HOME=/usr/local/cuda
export LD_LIBRARY_PATH=${CUDA_HOME}/lib64
export PATH=${CUDA_HOME}/bin:${PATH}
- 当
/usr/local
没有cuda软连接时,直接硬链接:
export PATH=/usr/local/cuda-xx.x/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-xx.x/lib64:$LD_LIBRARY_PATH
- 刷新配置文件:
source ~/.bashrc
,使配置生效。 - 验证安装结果:安装完成后输入
nvcc -V
,若显示正常则安装成功。 - 分别查看nvidia驱动和cuda版本,更新完成。