【官方双语】一个视频理解神经网络注意力机制,详细阐释!

3.3万
121
2024-05-26 16:08:27
826
372
1234
113
注意力机制是Transformer和大型语言模型(如ChatGPT)背后最重要的概念之一。然而,这个概念并不那么复杂。在这个StatQuest中,我们将注意力机制添加到一个基本的序列到序列(Seq2Seq或编码器-解码器)模型中,并逐步讲解它的工作原理和计算方法。BAM!!! 字幕校对、翻译、时间轴调整:@电风扇贩卖机 视频校对及上传:@凡鸟不凡 相关视频链接: 神经网络基本思想:https://www.bilibili.com/video/BV18m411S79t/?spm_id_from=333.999.0.0 RNN:https://www.bilibili.com/video/BV1UH4y1A7Bg/?spm_id_from=333.999.0.0 LSTM:https://www.bilibili.com/video/BV1zD421N7nA/?spm_id_from=333.999.0.0 词嵌入:https://www.bilibili.com/video/BV1Km421u7uu/?spm_id_from=333.999.0.0 seq2seq 编码-解码神经网络:https://www.bilibili.com/video/BV1xZ4214797/?spm_id_from=333.999.0.0 如果这个视频对你有所帮助,不要忘了一键三连和关注,欢迎分享给小伙伴一起学习呀!  -----------------------------------------------------------------------  如果您想支持StatQuest,请考虑... 购买我的书,《StatQuest机器学习图解指南》:  PDF版本 - https://statquest.gumroad.com/l/wvtmc  纸质版 - https://www.amazon.com/dp/B09ZCKR4H6 Kindle电子书版 - https://www.amazon.com/dp/B09ZG79HXC  -----------------------------------------------------------------------  StatQuest 旨在用通俗易懂的方式讲解统计学、机器学习等,将主要方法论分解成易于理解的部分,以增强理解。更多关于StatQuest: 官网:https://statquest.org/  YouTube:https://www.youtube.com/@statquest Patreon: https://www.patreon.com/statquest 音乐:https://joshuastarmer.bandcamp.com/album/the-middle-ages  周边商店:https://statquest.creator-spring.com/? StatQuest Store: https://statquest.org/statquest-store/
StatQuest 官方账号,深入浅出讲解深度学习、机器学习、统计学原理!https://statquest.org
自动连播
136.6万播放
简介
引言
00:49
神经网络基本思想
18:41
链式法则
18:24
梯度下降法
23:54
反向传播基本思想
17:33
反向传播详解P1
18:32
反向传播详解P2
13:09
ReLU激活函数
09:00
神经网络多元输入输出
13:50
SoftMax 和 ArgMax
14:03
SoftMax导数
07:13
交叉熵 Cross Entropy
09:32
交叉熵+反向传播
22:08
卷积神经网络CNN+图像识别
15:24
用数学表示神经网络
30:01
张量 tensor
09:40
PyTorch
23:22
PyTorch优化神经网络
20:45
RNN
16:37
LSTM
20:45
词嵌入、word2vec模型
16:12
word embedding代码实现
32:02
编码&解码神经网络,seq2seq模型
16:51
注意力机制
15:52
Transformer模型
36:15
Decoder-only Transformer模型
36:45
Transformer数学原理
23:43
Transformer代码实现
30:53
客服
顶部
赛事库 课堂 2021拜年纪