QNNPack之间接优化算法【推理引擎】Kernel优化第05篇

2228
6
2023-03-03 20:50:00
55
16
23
3
【推理引擎】Kernel优化第05篇:QNNPack之间接优化算法!!! 推理引擎中的最最重要的一层,Kernel层承载了针对NPU、CPU、GPU等不同IP后端硬件的算子,或者Kernel实现。在Kernel优化中,QNNPACK 击败了所有神经网络量化领域的用于移动端加速库,其核心是间接卷积优化算法!
昇腾招人,已经毕业的快联系鸭

更适合中国大学生体质的论文辅助工具!

2.5万播放 icon 简介
《Kernel优化》在上层应用或者 AI 网络模型中,看到的是算子;但是在推理引擎实际执行的是具体的 Kernel,而推理引擎中 CNN 占据了主要是得执行时间,因此其 Kernel 优化尤为重要。
01 Kernel优化架构介绍
05:59
02 卷积操作基础原理
13:48
03 Im2Col算法
15:56
04 Winograd算法
14:32
05 QNNPack之间接优化算法
11:53
06 内存布局方式
12:52
客服
顶部
赛事库 课堂 2021拜年纪