投稿

低比特量化基本原理！【推理引擎】模型压缩系列第02篇

1.4万

24

2023-01-21 13:15:00

正在缓冲...

【推理引擎】模型压缩系列第02篇：低比特量化核心原理！量化计算公式和量化的方法！模型量化是一种将浮点计算转成低比特定点计算的技术，可以有效的降低模型计算强度、参数大小和内存消耗。尤其是在极低比特(<4bit)、二值网络(1bit)、甚至将梯度进行量化时，带来的精度挑战更大。这里一起去了解下低比特量化的计算公式和基本方法，深入量化的原理。

模型小型化

轻量化网络

ZOMI酱发消息

AIInfra制造机(github.com/chenzomi12/AIInfra)，归隐中~

【物理重构】听听学姐怎么说！

爱吃桃子的COCO

01 模型压缩架构和流程

04:17

02 低比特量化原理

13:48

03 感知量化训练QAT原理

12:08

04 训练后量化PTQ与量化部署

14:16

05 模型剪枝核心原理

14:22

06(上) 知识蒸馏原理

09:32

06(下) 知识蒸馏算法解读

13:58

顶部