运维打铁:Linux Centos 7 安装更新GPU driver驱动和cuda
文章目录
- 一、查看显卡版本命令
- 二、更新驱动
- 2.1 下载显卡驱动
- 2.2 安装前配置
- 2.3 安装显卡驱动
- 三、下载更换cuda版本
- 3.1 下载cuda
- 3.2 安装过程选项处理
- 3.3 配置环境变量
一、查看显卡版本命令
- 查看GPU驱动版本及支持的最高cuda版本
- 命令:
nvidia-smi - 作用:显示GPU驱动版本和driverAPI(支持的最高cuda版本)。
- 命令:
- 动态监控显卡状态
- 命令:
watch -n 1 nvidia-smi - 作用:每隔1秒动态监控显卡状态。
- 命令:
- 查看cuda版本及运行时API
- 命令:
nvcc -V - 作用:显示cuda版本和timeAPI(运行时API)。
- 命令:
二、更新驱动
2.1 下载显卡驱动
-
查看显卡信息
- 命令:
lspci | grep -i nvidia - 作用:查看自己的显卡信息。

- 命令:
-
下载驱动
- 登录NVIDIA官方网站(官方驱动 | NVIDIA),根据自己的显卡信息选择适合的驱动型号和版本,保存为.run文件。

- 登录NVIDIA官方网站(官方驱动 | NVIDIA),根据自己的显卡信息选择适合的驱动型号和版本,保存为.run文件。
2.2 安装前配置
- 验证系统是否安装必要工具
- 验证命令:
gcc –vg++ -v
- 安装命令:若未安装,使用
yum install gcc gcc-c++ tar make进行安装。
- 验证命令:
- 安装kernel-header包
- 若未安装,使用
yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)进行安装。
- 若未安装,使用
- 卸载已安装的驱动
- 命令:
sudo /usr/bin/nvidia-uninstall - 注意:出现xconfig选择yes。
- 命令:
- 查询并禁用Nouveau模块
- 查询命令:
lsmod | grep nouveau - 若有输出表示该模块正在运行,需要禁用。
- 禁用方法:
- 编辑文件
vim /usr/lib/modprobe.d/blacklist-nouveau.conf,按I进入插入模式,写入以下内容:
- 编辑文件
- 查询命令:
blacklist nouveau
options nouveau modeset=0
- 按`esc`退出插入模式,按`shift + :`,输入`wq`保存并退出文件。
- 使内核生效并重启服务器:
- `dracut -f`
- `systemctl set-default multi-user.target`
- `reboot`
- 再次查询:`lsmod | grep nouveau`,若无输出则禁用成功。
2.3 安装显卡驱动
-
上传驱动程序:将下载好的驱动程序(如
NVIDIA-Linux-x86_64-460.106.00.run)上传至GPU节点(服务器)。 -
赋予执行权限并安装
- 命令:
sudo chmod a+x NVIDIA-Linux-x86_64-460.106.00.runsudo ./NVIDIA-Linux-x86_64-460.106.00.run
- 命令:
-
安装过程处理

- 安装过程中若显示问题,选择
NO继续。 - 若出现警告可忽略,直至安装完成。
- 安装过程中若显示问题,选择
-
验证安装结果:安装后输入
nvidia-smi,若显示正常则安装成功。

三、下载更换cuda版本
3.1 下载cuda
到官网(CUDA Toolkit Archive | NVIDIA Developer)找到所需的cuda版本,选择对应主机(服务器)的下载安装命令。例如,安装CUDA - 11.1:
wget https://developer.download.nvidia.com/compute/cuda/11.1.1/local_installers/cuda_11.1.1_455.32.00_linux.run
sudo sh cuda_11.1.1_455.32.00_linux.run

3.2 安装过程选项处理
- 同意协议:选择
accept。 - 不要勾选
driver(按空格使[ ]中没有X)。 - 选择
YES替换旧的软连接。



3.3 配置环境变量
在vi ~/.bashrc文件末端加上配置信息,以下两种配置二选一:
- 当
/usr/local中有cuda的软连接时:
export CUDA_HOME=/usr/local/cuda
export LD_LIBRARY_PATH=${CUDA_HOME}/lib64
export PATH=${CUDA_HOME}/bin:${PATH}
- 当
/usr/local没有cuda软连接时,直接硬链接:
export PATH=/usr/local/cuda-xx.x/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-xx.x/lib64:$LD_LIBRARY_PATH
- 刷新配置文件:
source ~/.bashrc,使配置生效。 - 验证安装结果:安装完成后输入
nvcc -V,若显示正常则安装成功。
- 分别查看nvidia驱动和cuda版本,更新完成。


