低比特量化基本原理!【推理引擎】模型压缩系列第02篇

9840
17
2023-01-21 13:15:00
282
210
233
34
【推理引擎】模型压缩系列第02篇:低比特量化核心原理!量化计算公式和量化的方法! 模型量化是一种将浮点计算转成低比特定点计算的技术,可以有效的降低模型计算强度、参数大小和内存消耗。尤其是在极低比特(<4bit)、二值网络(1bit)、甚至将梯度进行量化时,带来的精度挑战更大。这里一起去了解下低比特量化的计算公式和基本方法,深入量化的原理。
昇腾招人,已经毕业的快联系鸭

电脑桌面上养老婆?我也想要!

7.6万播放 icon 简介
《模型压缩》模型压缩跟轻量化网络模型不同,压缩主要是对轻量化或者非轻量化模型执行剪枝、蒸馏、量化等压缩算法和手段,使得模型更加小、更加轻便、更加利于执行。
01 模型压缩架构和流程
04:17
02 低比特量化原理
13:48
03 感知量化训练QAT原理
12:08
04 训练后量化PTQ与量化部署
14:16
05 模型剪枝核心原理
14:22
06(上) 知识蒸馏原理
09:32
06(下) 知识蒸馏算法解读
13:58
客服
顶部
赛事库 课堂 2021拜年纪