感知量化训练QAT原理!伪量化节点计算方式!【推理引擎】模型压缩系列第03篇

8423
23
2023-01-22 13:14:06
156
93
152
20
【推理引擎】模型压缩系列第03篇:感知量化训练QAT原理!伪量化节点计算方式!量化特性! 感知量化训练(Aware Quantization Training)模型中插入伪量化节点fake quant来模拟量化引入的误差。端测推理的时候折叠fake quant节点中的属性到tensor中,在端测推理的过程中直接使用tensor中带有的量化属性参数。
昇腾招人,已经毕业的快联系鸭
7.6万播放 icon 简介
《模型压缩》模型压缩跟轻量化网络模型不同,压缩主要是对轻量化或者非轻量化模型执行剪枝、蒸馏、量化等压缩算法和手段,使得模型更加小、更加轻便、更加利于执行。
01 模型压缩架构和流程
04:17
02 低比特量化原理
13:48
03 感知量化训练QAT原理
12:08
04 训练后量化PTQ与量化部署
14:16
05 模型剪枝核心原理
14:22
06(上) 知识蒸馏原理
09:32
06(下) 知识蒸馏算法解读
13:58
客服
顶部
赛事库 课堂 2021拜年纪