专栏/TensorFlow + RTX 3090环境适配

TensorFlow + RTX 3090环境适配

2021年01月11日 08:05--浏览 · --点赞 · --评论
粉丝:1810文章:21

在更换机箱与电源之后,RTX 3090终于点亮了!

RTX 3090成功点亮

欢呼!撒花!顺便安抚下我可怜的钱包!

我尽力记录了装机过程,感兴趣的小伙伴可以观看。

视频加载失败

不过新也有新的烦恼,当前TensorFlow使用的CUDA版本不支持RTX 3090,需要解决软硬件适配问题。


环境配置

操作系统是Ubuntu 20.04;TensorFlow版本为2.4。


安装驱动程序

RTX 30系显卡需要版本460的驱动程序。在终端下执行

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
sudo apt install nvidia-driver-460

执行完毕后可以通过 nvidia-smi 看到显卡信息。

nvidia-smi输出的显卡信息


安装CUDA

与版本460驱动对应的CUDA版本为11.2。遵循官方的安装指南即可。这里有一份Ubuntu 18.04下的安装过程视频,大同小异,可以参考。注意对应CUDA 11.2的cuDNN版本没有列出。好在我实际测试对应11.1的cuDNN也可以用。

视频加载失败


解决找不到文件问题

由于TensorFlow 2.4是基于CUDA 11.0构建的,所以安装CUDA 11.2会出现找不到文件的错误。具体涉及到三个文件: libcusolver.so 、 libcupti.so 与 ptxas 。前两个文件是Linux下的动态链接库。这两个文件已经随CUDA安装在了系统中,只需要让TensorFlow找到它们即可。可以通过建立软链接的方式实现。

ln -s /usr/local/cuda-11.2/targets/x86_64-linux/lib/libcupti.so  /usr/local/lib/libcupti.so.11.0
ln -s /usr/local/cuda/targets/x86_64-linux/lib/libcusolver.so ~/.local/lib/python3.8/site-packages/tensorflow/python/libcusolver.so.10

ptxas 为可执行文件,同样建立软链接至 $PATH 包含的目录即可。

sudo ln -s /usr/local/cuda/bin/ptxas /usr/local/bin/ptxas


性能测试

百闻不如一见,直接看视频。

视频加载失败


温度表现

RTX 3090官方给出的功耗为350瓦,这么大功率意味着发热量也一定很大。下边是在训练神经网络时记录下的温度变化曲线。

蓝色为GPU

CPU与GPU都采用水冷方案,从图中能够观察到温度的上升过程。整个过程中GPU基本满载(99%以上),CPU负载一半左右。系统的噪声在可以接受的范围内。


投诉或建议