CUDA11.8+cuDNN8.6.0环境配置
tm9161
2025年05月04日 14:59
收录于文集
共11篇

一、安装显卡驱动

1.操作系统安装完成后,安装显卡驱动,这里建议使用系统Additional Drivers,勾选需要安装的驱动,点击右下角的应用,就自动开始安装。(Windows操作系统在官网https://www.nvidia.cn/geforce/drivers/ 下载驱动并运行安装)

2.安装重启后运行一下nvidia-smi,如果正常运行出结果,说明显卡启动安装正常。

二、安装CUDA

1.进入NVIDIA官网(https://developer.nvidia.com/cuda-toolkit-archive)找到对应操作系统的CUDA并运行命令以下进行安装,我这里用的是CUDA11.8(RTX30系显卡)。

在终端立下面命令:

wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run

sudo sh cuda_11.8.0_520.61.05_linux.run

2.因驱动已经安装完成,安装CUDA时请将安装驱动的X取消,完成安装。

3.安装完毕后,运行下面指令配置环境变量。

sudo gedit ~/.bashrc

在下方加入这两行:

export PATH=$PATH:/usr/local/cuda-11.8/bin

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.8/lib64

运行下面指令更新环境变量:

source ~/.bashrc

(Windows操作系统下载后直接运行安装即可)

4.运行下面指定检测是否完成安装,如果结果为下图所示,表示安装完成。

nvcc -V

三、安装cuDNN

1.进入NVIDIA官网(https://developer.nvidia.com/rdp/cudnn-archive)我这里用的是cuDNN v8.6.0。

2.下载后,在文件所在文件夹打开终端,运行下面指令进行安装。

sudo dpkg -i cudnn-local-repo-ubuntu2204-8.6.0.163_1.0-1_amd64.deb

3.根据提示运行拷贝命令

sudo cp /var/cudnn-local-repo-ubuntu2204-8.6.0.163/cudnn-local-FAED14DD-keyring.gpg /usr/share/keyrings/

4.运行下方命令安装三个deb文件

cd /var/cudnn-local-repo-ubuntu2204-8.6.0.163/

sudo dpkg -i libcudnn8_8.6.0.163-1+cuda11.8_amd64.deb

sudo dpkg -i libcudnn8-dev_8.6.0.163-1+cuda11.8_amd64.deb

sudo dpkg -i libcudnn8-samples_8.6.0.163-1+cuda11.8_amd64.deb

(Windows操作系统下载后解压缩,将bin、include和lib文件拷贝到下图路径11.1改成对应的版本,比如11.8)

5.运行下面指定检测是否完成安装,如果结果为下图所示,表示安装完成。

cat /usr/include/x86_64-linux-gnu/cudnn_version_v8.h | grep CUDNN_MAJOR -A 2

四、Miniconda管理器

1.进入官网选择合适的版本(https://repo.anaconda.com/miniconda/),我这里选择的是Python3.8的版本。

2.下载后在所在文件夹打开终端,通过下面命令安装,安装过程中会询问协议、安装位置和环境变量等,直接yes和默认即可。

chmod +x Miniconda3-py38_23.11.0-2-Linux-x86_64.sh

sudo Miniconda3-py38_23.11.0-2-Linux-x86_64.sh

(Windows操作系统下后直接运行安装即可)

五、安装Pytorch

1.进入Pytorch官网选择合适的版本(https://pytorch.org/get-started/previous-versions/)这里用的是v2.1.2。

2.用pip安装完成后,运行下面命令,检测是否安装成功并启用了GPU,如果结果为下图所示,表示安装成功。

ipython

import torch

print(torch.cuda.is_available())

六、其他

在使用CUDA11.8版本的时候,发现使用GPU版本的TF(推荐使用TensorFlow 2.11.0)时会提示缺少libcusolver.so.10,发现文件中只有libcusolver.so.11,找到路径,使用命令(cp libcusolver.so.11  libcusolver.so.10)将libcusolver.so.11复制后,改名为libcusolver.so.10,解决问题。(Windows操作系统可以直接将libcusolver.so.11复制并改名)