
一、安装显卡驱动
1.操作系统安装完成后,安装显卡驱动,这里建议使用系统Additional Drivers,勾选需要安装的驱动,点击右下角的应用,就自动开始安装。(Windows操作系统在官网https://www.nvidia.cn/geforce/drivers/ 下载驱动并运行安装)

2.安装重启后运行一下nvidia-smi,如果正常运行出结果,说明显卡启动安装正常。
二、安装CUDA
1.进入NVIDIA官网(https://developer.nvidia.com/cuda-toolkit-archive)找到对应操作系统的CUDA并运行命令以下进行安装,我这里用的是CUDA11.8(RTX30系显卡)。
在终端立下面命令:
wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run
sudo sh cuda_11.8.0_520.61.05_linux.run

2.因驱动已经安装完成,安装CUDA时请将安装驱动的X取消,完成安装。

3.安装完毕后,运行下面指令配置环境变量。
sudo gedit ~/.bashrc
在下方加入这两行:
export PATH=$PATH:/usr/local/cuda-11.8/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.8/lib64

运行下面指令更新环境变量:
source ~/.bashrc
(Windows操作系统下载后直接运行安装即可)
4.运行下面指定检测是否完成安装,如果结果为下图所示,表示安装完成。
nvcc -V
三、安装cuDNN
1.进入NVIDIA官网(https://developer.nvidia.com/rdp/cudnn-archive)我这里用的是cuDNN v8.6.0。

2.下载后,在文件所在文件夹打开终端,运行下面指令进行安装。
sudo dpkg -i cudnn-local-repo-ubuntu2204-8.6.0.163_1.0-1_amd64.deb
3.根据提示运行拷贝命令
sudo cp /var/cudnn-local-repo-ubuntu2204-8.6.0.163/cudnn-local-FAED14DD-keyring.gpg /usr/share/keyrings/
4.运行下方命令安装三个deb文件
cd /var/cudnn-local-repo-ubuntu2204-8.6.0.163/
sudo dpkg -i libcudnn8_8.6.0.163-1+cuda11.8_amd64.deb
sudo dpkg -i libcudnn8-dev_8.6.0.163-1+cuda11.8_amd64.deb
sudo dpkg -i libcudnn8-samples_8.6.0.163-1+cuda11.8_amd64.deb

(Windows操作系统下载后解压缩,将bin、include和lib文件拷贝到下图路径11.1改成对应的版本,比如11.8)

5.运行下面指定检测是否完成安装,如果结果为下图所示,表示安装完成。
cat /usr/include/x86_64-linux-gnu/cudnn_version_v8.h | grep CUDNN_MAJOR -A 2

四、Miniconda管理器
1.进入官网选择合适的版本(https://repo.anaconda.com/miniconda/),我这里选择的是Python3.8的版本。

2.下载后在所在文件夹打开终端,通过下面命令安装,安装过程中会询问协议、安装位置和环境变量等,直接yes和默认即可。
chmod +x Miniconda3-py38_23.11.0-2-Linux-x86_64.sh
sudo Miniconda3-py38_23.11.0-2-Linux-x86_64.sh
(Windows操作系统下后直接运行安装即可)
五、安装Pytorch
1.进入Pytorch官网选择合适的版本(https://pytorch.org/get-started/previous-versions/)这里用的是v2.1.2。

2.用pip安装完成后,运行下面命令,检测是否安装成功并启用了GPU,如果结果为下图所示,表示安装成功。
ipython
import torch
print(torch.cuda.is_available())

六、其他
在使用CUDA11.8版本的时候,发现使用GPU版本的TF(推荐使用TensorFlow 2.11.0)时会提示缺少libcusolver.so.10,发现文件中只有libcusolver.so.11,找到路径,使用命令(cp libcusolver.so.11 libcusolver.so.10)将libcusolver.so.11复制后,改名为libcusolver.so.10,解决问题。(Windows操作系统可以直接将libcusolver.so.11复制并改名)
