算子融合了解下!AI编译器如何实现算子融合的?【AI编译器】系列之前端优化第03篇

5005
19
2022-12-16 15:43:01
131
86
102
22
【AI编译器】系列之前端优化第03篇:算子融合了解下!AI编译器如何实现算子融合的? AI编译器的前端主要是基于Graph IR(图层IR/计算图IR)进行操作,但是前端优化有很多种,其中最重要的要数算子融合,图层的算子融合是非常有效的方法,使用“计算换访存”的思想,加速整网的计算。算子融合Pass主要发生在图层,但是Kernel层也会借鉴算子融合的策略,提供大算子给AI框架。现在让我们一起深入了解下算子融合的方式和策略吧!
昇腾招人,已经毕业的快联系鸭

电脑桌面上养老婆?我也想要!

3.1万播放 icon 简介
随着深度学习的不断发展,AI 模型结构在快速演化,底层计算硬件技术更是层出不穷,对于广大开发者来说不仅要考虑如何在复杂多变的场景下有效的将算力发挥出来,还要应对计算框架的持续迭代。AI编译器就成了应对以上问题广受关注的技术方向,让用户仅需专注于上层模型开发,降低手工优化性能的人力开发成本,进一步压榨硬件性能空间。 AI编译器主要是分为前端优化、后端优化,部分还会有中间优化层,而这里面主要介绍AI编译器的前端优化涉及到的算法和优化Pass。
01 内容介绍
03:46
02 什么是图层IR
11:11
03 算子融合原理
17:48
04(上) 数据布局转换原理
16:29
04(下) 数据布局转换算法
13:54
05 内存分配/优化算法
17:09
06. 常量折叠原理
11:06
07.公共子表达式消除
08:30
08. 死代码消除原理
06:24
09. 代数化简原理
09:30
10. 总结:前端优化Pass的排序
04:58
客服
顶部
赛事库 课堂 2021拜年纪