汉语自然语言处理-从零解读碾压循环神经网络的transformer模型(一)-注意力机制-位置编码-attention is all you need

4.7万
398
2019-07-07 20:57:44
1805
1992
3320
387
由于transformer模型的结构比较特殊, 所以一下理解不好很正常, 不过经过仔细思考和体会的话, 理解应该不是问题, 视频里有一点表达的不到位, attention机制其实使用这句话中所有字来表达句子中的一个字, 看注意力机制的时候请结合理解一下. 源码地址: https://github.com/aespresso/a_journey_into_math_of_ml 知乎专栏: https://zhuanlan.zhihu.com/p/67585925 如果对你有帮助, 请订阅我的频道
espresso_ml@hotmail.com
客服
顶部
赛事库 课堂 2021拜年纪