【Ubuntu2404】Ubuntu24.04安装NVIDIA驱动/CUDA/cuDNN搭建神经网络训练环境
Ubuntu24.04安装NVIDIA驱动/CUDA/cuDNN搭建神经网络训练环境
- 引言
- 一、安装NVIDIA驱动
- 1.1 从系统工具中安装
- 1.2 检验是否按安装成功
- 二、安装CUDA
- 2.1 通过apt-get安装CUDA
- 2.2 检验是否按安装成功
- 三、安装cuDNN
- 3.1 查看CUDA版本
- 3.2 下载并安装cuDNN
- 3.3 检验cuDNN是否安装成功
引言
NVIDIA 驱动 、CUDA 和 cuDNN 是紧密相关但各自具有独特功能的技术,它们共同为图形处理单元(GPU)加速的应用程序提供了强大的支持。本文主要介绍如何安装 NVIDIA 驱动、CUDA 及 cuDNN ,为后续神经网络训练提供支持。本文主要介绍Ubuntu24.04安装NVIDIA驱动、CUDA和cuDNN的流程。
另外需要说明的是,仅 NVIDIA 系列显卡支持,如需查看本机显卡情况,可以使用如下命令:
lspci | grep -i nvidia
charleswyq@charleswyq-ThinkBook-16p-G5-IRX:~$ lspci | grep -i nvidia
01:00.0 VGA compatible controller: NVIDIA Corporation AD107M [GeForce RTX 4060 Max-Q / Mobile] (rev a1)
01:00.1 Audio device: NVIDIA Corporation Device 22be (rev a1)
一、安装NVIDIA驱动
NVIDIA驱动使得操作系统和应用程序能够与 NVIDIA GPU 进行通信。驱动程序包含了GPU的硬件抽象层,通过它操作系统可以管理和分配GPU资源,如显存和计算核心。对于使用 NVIDIA 显卡的系统来说,安装正确的驱动是确保图形显示正常以及利用GPU加速计算能力的关键。
1.1 从系统工具中安装
由于Ubuntu24.04对 NVIDIA 有相关支持,可以从 软件和更新 - 附加驱动 中安装。

重要提醒:不建议从官网上下载手动安装,否则可能会无法使用,导致 nvidia-smi 命令报错。变更回来会更加麻烦,可能导致根本无法使用最后重装系统(血的教训)。
1.2 检验是否按安装成功
在终端中输入如下命令检验安装情况:
nvidia-smi

如果出现上图内容说明已经安装成功,一般来说使用系统工具进行安装就不会出错。
另外需要记下本机的 CUDA 版本,表格中右上角就是,后续安装cuDNN时需要使用。
Driver Version: 550.120
CUDA Version: 12.4
二、安装CUDA
CUDA是由 NVIDIA 开发的一个并行计算平台和应用编程接口(API),它允许开发者编写能够在 NVIDIA GPU 上执行的代码。CUDA 支持 C、C++ 和 Fortran 等多种编程语言,并提供了一套丰富的库来简化开发过程。通过 CUDA,开发者可以充分利用 GPU 中大量的并行处理单元来进行高性能计算任务,例如机器学习、图像处理、科学模拟等。CUDA 还包括了调试工具、性能分析器和其他辅助工具,帮助开发者优化他们的应用程序。
重要提醒:这里同样不建议手动下载安装,原因同上。 CUDA 安装失败比 NVIDIA Driver 更难处理。
2.1 通过apt-get安装CUDA
打开终端,直接通过 apt-get 进行安装。
sudo apt-get install nvidia-cuda-toolkit
2.2 检验是否按安装成功
在终端中输入如下命令检验安装情况:
nvcc -V

如果出现上图内容说明已经安装成功,一般来说使用 apt-get 进行安装就不会出错。
三、安装cuDNN
cuDNN 是一个专门针对深度神经网络(DNN)优化的库,它构建在 CUDA 之上。cuDNN 提供了高度优化的原语(primitives),用于实现常见的深度学习操作,如卷积、池化、激活函数等。这些原语经过精心设计,以最大限度地提高性能并减少内存占用,从而加速深度学习模型的训练和推理过程。cuDNN 支持流行的深度学习框架,如 TensorFlow、PyTorch 和 MXNet,因此开发者可以直接集成 cuDNN 来提升其模型的运行效率。
3.1 查看CUDA版本
在终端中输入如下命令查看 CUDA 版本,如果无法运行说明 NVIDIA 驱动安装错误,请完整卸载后重新安装。
nvidia-smi

如表中右上角所示, CUDA 版本为 12.4 。
CUDA Version: 12.4
3.2 下载并安装cuDNN
下载链接:cuDNN (官网)
这里推荐从官网下载并安装 cuDNN 。进入官网后,根据自己的需要选择合适版本的 cuDNN 。

根据官网中所示代码进行在线安装。
wget https://developer.download.nvidia.com/compute/cudnn/9.6.0/local_installers/cudnn-local-repo-ubuntu2404-9.6.0_1.0-1_amd64.deb
sudo dpkg -i cudnn-local-repo-ubuntu2404-9.6.0_1.0-1_amd64.deb
sudo cp /var/cudnn-local-repo-ubuntu2404-9.6.0/cudnn-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cudnn

整个下载及安装过程还是比较迅速的。

3.3 检验cuDNN是否安装成功
注:需要安装
PyTorch
打开终端,并启用 Python :
python

在 Python 环境中输入如下程序:
from torch.backends import cudnn
cudnn.is_available()
如返回 True 则说明cuDNN能够使用。


