混合并行?多维并行?有多维度混合在一起并行吗?【分布式并行】系列第06篇

3054
1
2022-11-06 17:35:22
78
56
44
8
【分布式并行】系列第06篇:混合并行?多维并行?有多维度混合在一起并行吗? 在第七节的内容里面分享了数据并行、模型并行(张量并行、流水并行),实际在大模型、大规模分布式AI集群中许多训练的场景都需要数据并行、按Tensor切分的模型并行以及pipeline并行一起来进行,才能实现一个很好的训练加速。多维混合并行主要是指把数据并行、张量并行、流水并行混合搭配使用,一起用都不累。那么最经典的用RL推荐大模型、LLM语言大模型来看看如何把多维混合在一起吧!
昇腾招人,已经毕业的快联系鸭
4.0万播放 icon 简介
随着深度学习中的数据规模和网络规模越来越大,训练神经网络会耗费越来越多的时间,势必需要从单 GPU 训练向多 GPU 训练甚至多机训练进行扩展。比如在大规模人脸识别中,训练上千万人脸 ID 需要对最后的全连接层做模型并行,而 GPT-3 为代表的大模型更是有 1750 亿参数,需要在多台机器上做流水并行、模型并行、数据并行、张量并行等并行策略才能训起来。
01. 分布式并行内容介绍
03:31
02.数据并行算法
13:50
03.模型并行之张量并行
16:19
04.张量自动并行
06:12
05.模型并行之流水并行
15:28
06. 混合并行算法
15:33
07.分布式并行策略总结
13:07
客服
顶部
赛事库 课堂 2021拜年纪