徐州市文章资讯

Ubuntu安装NVIDIA显卡驱动、CUDA以及CuDNN工具

2026-03-25 20:11:02 浏览次数:2
详细信息

一、安装NVIDIA显卡驱动

方法1:使用官方PPA(推荐)

# 1. 更新系统包
sudo apt update
sudo apt upgrade -y

# 2. 检测显卡型号
lspci | grep -i nvidia

# 3. 添加显卡驱动PPA
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update

# 4. 查看可用驱动版本
ubuntu-drivers devices

# 5. 自动安装推荐驱动(或手动指定版本)
sudo ubuntu-drivers autoinstall
# 或手动安装指定版本
# sudo apt install nvidia-driver-535  # 根据推荐的版本号

# 6. 重启系统
sudo reboot

# 7. 验证安装
nvidia-smi

方法2:使用官方.run文件

# 1. 卸载旧驱动
sudo apt purge nvidia*
sudo apt autoremove

# 2. 禁用nouveau驱动
echo -e "blacklist nouveau\noptions nouveau modeset=0" | sudo tee /etc/modprobe.d/blacklist-nouveau.conf
sudo update-initramfs -u
sudo reboot  # 重启

# 3. 下载官方驱动
# 访问 https://www.nvidia.cn/Download/index.aspx 选择对应驱动
# 或使用命令行(示例为版本535)
wget https://us.download.nvidia.com/XFree86/Linux-x86_64/535.154.05/NVIDIA-Linux-x86_64-535.154.05.run

# 4. 安装依赖
sudo apt install build-essential libglvnd-dev pkg-config

# 5. 关闭图形界面
sudo systemctl stop gdm  # 或 lightdm
sudo telinit 3

# 6. 安装驱动
sudo sh NVIDIA-Linux-x86_64-*.run

二、安装CUDA Toolkit

方法1:使用APT仓库(推荐)

# 1. 下载CUDA安装包(选择适合版本)
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb

# 2. 安装密钥包
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt update

# 3. 安装CUDA(完整安装)
sudo apt install cuda -y

# 4. 或安装指定版本
# sudo apt install cuda-12-3  # CUDA 12.3

# 5. 配置环境变量
echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

# 6. 验证安装
nvcc --version

方法2:使用.run文件

# 1. 从官网下载(例如CUDA 12.3)
wget https://developer.download.nvidia.com/compute/cuda/12.3.0/local_installers/cuda_12.3.0_545.23.06_linux.run

# 2. 运行安装程序
sudo sh cuda_12.3.0_545.23.06_linux.run
# 注意:如果已经安装了驱动,在安装选项中去掉Driver的勾选

三、安装cuDNN

方法1:使用.deb包安装

# 1. 从NVIDIA官网下载cuDNN
# 需要注册账号:https://developer.nvidia.com/cudnn
# 选择对应CUDA版本的cuDNN

# 2. 安装运行时库(示例为CUDA 12.x)
sudo dpkg -i cudnn-local-repo-ubuntu2204-8.9.7.29_1.0-1_amd64.deb

# 3. 导入密钥
sudo cp /var/cudnn-local-repo-*/cudnn-local-*-keyring.gpg /usr/share/keyrings/

# 4. 更新并安装
sudo apt update
sudo apt install libcudnn8 libcudnn8-dev libcudnn8-samples

# 5. 验证安装
cp -r /usr/src/cudnn_samples_v8/ $HOME
cd $HOME/cudnn_samples_v8/mnistCUDNN
make clean && make
./mnistCUDNN

方法2:使用.tgz文件安装

# 1. 下载cuDNN tar文件
# cudnn-linux-x86_64-8.9.7.29_cuda12-archive.tar.xz

# 2. 解压并复制文件
tar -xvf cudnn-linux-x86_64-*.tar.xz
sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include
sudo cp -P cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

# 3. 验证版本
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

四、验证完整安装

# 检查NVIDIA驱动
nvidia-smi

# 检查CUDA
nvcc --version

# 检查cuDNN
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

# 运行CUDA测试程序
cd /usr/local/cuda/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

# 测试PyTorch是否能用GPU
python3 -c "import torch; print(torch.cuda.is_available())"

五、常见问题解决

1. 显卡驱动无法安装

# 禁用Secure Boot
sudo mokutil --disable-validation
# 或进入BIOS关闭Secure Boot

2. CUDA版本冲突

# 移除旧版本
sudo apt remove --purge cuda*
sudo apt autoremove

# 清理/usr/local/cuda软链接
sudo rm -rf /usr/local/cuda*

3. 更新环境变量

# 如果命令找不到,确保路径正确
echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

六、安装PyTorch/TensorFlow

# PyTorch(带CUDA支持)
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

# TensorFlow(带GPU支持)
pip3 install tensorflow[and-cuda]

# 或使用conda
conda install pytorch torchvision torchaudio cudatoolkit=11.8 -c pytorch -c conda-forge

重要提示:

驱动、CUDA和cuDNN版本需要匹配 安装前查看官方兼容性矩阵 建议使用长期支持版(LTS)以获得更好的稳定性 如果使用Docker,可直接使用NVIDIA官方镜像避免复杂的安装过程
相关推荐