训练后量化PTQ深度解读!与量化部署核心原理!【推理引擎】模型压缩系列第04篇

8014
16
2023-01-23 11:05:00
153
80
166
19
【推理引擎】模型压缩系列第04篇:训练后量化QAT深度解读!与量化部署核心原理! 训练后量化分为动态离线量化(Post Training Quantization Dynamic, PTQ Dynamic)和静态离线量化(Post Training Quantization Static, PTQ Static),不管是哪种量化方式,同样需要在端侧真正部署起来。
昇腾招人,已经毕业的快联系鸭
7.6万播放 icon 简介
《模型压缩》模型压缩跟轻量化网络模型不同,压缩主要是对轻量化或者非轻量化模型执行剪枝、蒸馏、量化等压缩算法和手段,使得模型更加小、更加轻便、更加利于执行。
01 模型压缩架构和流程
04:17
02 低比特量化原理
13:48
03 感知量化训练QAT原理
12:08
04 训练后量化PTQ与量化部署
14:16
05 模型剪枝核心原理
14:22
06(上) 知识蒸馏原理
09:32
06(下) 知识蒸馏算法解读
13:58
客服
顶部
赛事库 课堂 2021拜年纪