Ubuntu Service 24.04 命令行安装 NVIDIA CUDA
标注:
Ubuntu版本:Ubuntu Service 24.04
显卡驱动版本:nvidia-driver-570-server
CUDA驱动版本:CUDA Toolkit 12.6.0 (August 2024), Versioned Online Documentation
注意事项:
在多设备下安装时发现,UEFI-安全启动的设备,可能会出现安装失败,需要到BIOS中关闭安全启动,如果根据步骤安装显卡驱动报错,请自行甄别是否存在该情况。
安装前置:
1.在安装新驱动程序之前,建议卸载任何现有的 NVIDIA 驱动程序,避免冲突。卸载旧驱动程序命令。
sudo apt remove --purge '^nvidia-.*'
2.如果之前你已启用 Nouveau 驱动,可能需要将其禁用,连续执行以下两条命令:
sudo bash -c "echo blacklist nouveau > /etc/modprobe.d/blacklist-nvidia-nouveau.conf"
sudo bash -c "echo options nouveau modeset=0 >> /etc/modprobe.d/blacklist-nvidia-nouveau.conf"
3.执行以下命令。确认是否禁用 Nouveau 驱动成功:
cat /etc/modprobe.d/blacklist-nvidia-nouveau.conf

3.最后运行以下命令更新 initramfs:
sudo update-initramfs -u
显卡驱动安装开始
1.更新系统。
sudo apt update
sudo apt upgrade
2.添加 NVIDIA 官方 PPA,一定要确保系统已经成功添加 graphics-drivers PPA 存储库。
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update

3.检查graphics-drivers PPA 存储库:
sudo apt list nvidia-driver*

3.查看当前显卡支持驱动版本,驱动程序版本关乎后续使用什么版本的CUDA驱动,建议高版本。
ubuntu-drivers devices

4.安装驱动程序,以570-service版本为例子。可以进一步查看显卡驱动版本支持的CUDA工具包:NVIDIA CUDA Toolkit Release Notes
sudo apt install nvidia-driver-570-server

5.重启系统。
sudo reboot
6.验证驱动安装
nvidia-smi

CUDA工具包安装开始
官网CUDA工具包:CUDA Toolkit Archive | NVIDIA Developer
显卡驱动支持的CUDA工具包:NVIDIA CUDA Toolkit Release Notes
注意:不同的CUDA版本,需要检查当前显卡驱动是否支持,如果支持,将1->6的安装步骤的命令,替换为官网CUDA工具包提供的CUDA Toolkit Installer:

1.以CUDA 12.6.0为例,下载并配置 CUDA APT pin。
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-ubuntu2404.pin
sudo mv cuda-ubuntu2404.pin /etc/apt/preferences.d/cuda-repository-pin-600
2.下载 CUDA 12.6 本地安装包。
wget https://developer.download.nvidia.com/compute/cuda/12.6.0/local_installers/cuda-repo-ubuntu2404-12-6-local_12.6.0-560.28.03-1_amd64.deb
3.安装 CUDA 本地仓库。
sudo dpkg -i cuda-repo-ubuntu2404-12-6-local_12.6.0-560.28.03-1_amd64.deb
4.添加 GPG 密钥
sudo cp /var/cuda-repo-ubuntu2404-12-6-local/cuda-*-keyring.gpg /usr/share/keyrings/
5.更新 APT 包索引。
sudo apt-get update
6.安装 CUDA Toolkit 12.6。
sudo apt-get -y install cuda-toolkit-12-6
7.依次执行以下三条命令配置环境变量,并执行第四条命令检查配置:
echo 'export PATH=/usr/local/cuda-12.6/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-12.6/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc
echo $PATH

8.重启系统。
sudo reboot
9.验证 CUDA 安装。
nvcc --version

安装到处结束

