低比特量化基本原理!【推理引擎】模型压缩系列第02篇

1.4万
24
2023-01-21 13:15:00
正在缓冲...
364
298
312
42
【推理引擎】模型压缩系列第02篇:低比特量化核心原理!量化计算公式和量化的方法! 模型量化是一种将浮点计算转成低比特定点计算的技术,可以有效的降低模型计算强度、参数大小和内存消耗。尤其是在极低比特(<4bit)、二值网络(1bit)、甚至将梯度进行量化时,带来的精度挑战更大。这里一起去了解下低比特量化的计算公式和基本方法,深入量化的原理。
AIInfra制造机(github.com/chenzomi12/AIInfra),归隐中~
自动连播
11.1万播放
简介
01 模型压缩架构和流程
04:17
02 低比特量化原理
13:48
03 感知量化训练QAT原理
12:08
04 训练后量化PTQ与量化部署
14:16
05 模型剪枝核心原理
14:22
06(上) 知识蒸馏原理
09:32
06(下) 知识蒸馏算法解读
13:58
客服
顶部
赛事库 课堂 2021拜年纪