标准流(normalizing in flow)模型,它是一种生成模型,与生成对抗模型(它以一种模糊的方式对目标数据的分布进行建模)不同的是,可以显示地写出目标分布的概率表达式,并通过优化最大化对数似然函数来进行模型调参和拟合。此外,标准流模型还是可逆的,训练和推理过程都是全并行的,使用的是1×1的卷积(不再局部建模,而是通道融合,可以看成通道层面的全连接MLP),可以进行通道融合。
transformer分为self-attention(嵌入跟周围嵌入进行相互作用。但并没有对嵌入的维度之间的作用,这部分由FNN来做)和FNN
normalization flow指的是x经过一次次变换变成一个标准分布z
x的pdf写出来之后可以通过最大化似然来写出目标函数,从而进行学习
难点是定义一系列可逆函数f_i并且使得对数行列式好求。基本想法,雅可比矩阵弄成三角矩阵,好求det。