在更换机箱与电源之后,RTX 3090终于点亮了!

欢呼!撒花!顺便安抚下我可怜的钱包!
我尽力记录了装机过程,感兴趣的小伙伴可以观看。

不过新也有新的烦恼,当前TensorFlow使用的CUDA版本不支持RTX 3090,需要解决软硬件适配问题。
环境配置
操作系统是Ubuntu 20.04;TensorFlow版本为2.4。
安装驱动程序
RTX 30系显卡需要版本460的驱动程序。在终端下执行
执行完毕后可以通过 nvidia-smi 看到显卡信息。

安装CUDA
与版本460驱动对应的CUDA版本为11.2。遵循官方的安装指南即可。这里有一份Ubuntu 18.04下的安装过程视频,大同小异,可以参考。注意对应CUDA 11.2的cuDNN版本没有列出。好在我实际测试对应11.1的cuDNN也可以用。

解决找不到文件问题
由于TensorFlow 2.4是基于CUDA 11.0构建的,所以安装CUDA 11.2会出现找不到文件的错误。具体涉及到三个文件: libcusolver.so 、 libcupti.so 与 ptxas 。前两个文件是Linux下的动态链接库。这两个文件已经随CUDA安装在了系统中,只需要让TensorFlow找到它们即可。可以通过建立软链接的方式实现。
ptxas 为可执行文件,同样建立软链接至 $PATH 包含的目录即可。
性能测试
百闻不如一见,直接看视频。

温度表现
RTX 3090官方给出的功耗为350瓦,这么大功率意味着发热量也一定很大。下边是在训练神经网络时记录下的温度变化曲线。

CPU与GPU都采用水冷方案,从图中能够观察到温度的上升过程。整个过程中GPU基本满载(99%以上),CPU负载一半左右。系统的噪声在可以接受的范围内。