推理引擎内存布局方式【推理引擎】Kernel优化第06篇

4662
7
2023-03-04 20:50:00
129
65
160
12
【推理引擎】Kernel优化第06篇:推理引擎内存布局方式!!! 在深度学习AI训练框架中主要有两种内存排布方式,NCHW 和 NHWC。而在推理引擎里面,或者底层Kernel层实际上为了更加适配到DSA或者ASIC专用芯片会使用NCHWX内存排布格式,让我们了解下不同排布格式的作用吧!
昇腾招人,已经毕业的快联系鸭

电脑桌面上养老婆?我也想要!

2.5万播放 icon 简介
《Kernel优化》在上层应用或者 AI 网络模型中,看到的是算子;但是在推理引擎实际执行的是具体的 Kernel,而推理引擎中 CNN 占据了主要是得执行时间,因此其 Kernel 优化尤为重要。
01 Kernel优化架构介绍
05:59
02 卷积操作基础原理
13:48
03 Im2Col算法
15:56
04 Winograd算法
14:32
05 QNNPack之间接优化算法
11:53
06 内存布局方式
12:52
客服
顶部
赛事库 课堂 2021拜年纪