[personal chatgpt] 从 RoPE 到 CoPE(绝对位置编码,相对位置编码,Contextual Position Encoding)

8686
1
2024-06-08 07:15:00
正在缓冲...
290
126
657
69
本期 code:https://github.com/chunhuizhang/personal_chatgpt/blob/main/tutorials/position_encoding/rope_cope.ipynb llama rope: https://www.bilibili.com/video/BV1Dh4y1P7KY/ https://www.bilibili.com/video/BV18u411M7j1/ bert 位置编码:https://www.bilibili.com/video/BV1X94y1R7La/
数学,计算机科学,现代人工智能。bridge the gap。
personal chatgpt
(28/30)
自动连播
22.1万播放
简介
[LLMs 实践] 01 llama、alpaca、vicuna 整体介绍及 llama 推理过程
20:24
[LLMs 实践] 02 LoRA(Low Rank Adaption)基本原理与基本概念,fine-tune 大语言模型
17:27
[LLMs 实践] 03 LoRA fine-tune 大语言模型(peft、bloom 7b)
27:25
[LLMs 实践] 04 PEFT/LoRA 源码分析
13:21
[番外] float16 与 bf16 表示和计算细节
13:27
[LLMs 实践] 06 LLaMA,Alpaca LoRA 7B 推理
14:13
[LLMs 实践] 07 fp16 与自动混合精度训练(amp)显著提升 batch size
11:55
[LLMs 实践] 08 LLM.int8 量化细节 (load_in_8bit)以及 bitsandbytes 库
18:12
[LLMs 实践] 09 BPE gpt2 tokenizer 与 train tokenizer
21:30
[LLMs 实践] 10 预训练语料,mapping & streaming(load_dataset)
15:05
[LLMs 实践] 11 gradient accumulation 显存优化 trick
08:22
[LLMs 实践] 12 LLM SFT training (trl SFTTrainer、alpaca dataset)
10:34
[LLMs 实践] 13 gradient checkpointing 显存优化 trick
13:38
[LLMs 实践] 14 llama2 introduction 及 fine tune llama2(guanaco dataset)
17:20
[LLMs 实践] 15 llama2 源码初步(text completion & chat completion)
22:34
[personal chatgpt] trl 基础介绍:reward model,ppotrainer
16:51
[LLMs 实践] 17 llama2 源码分析(RMSNorm 与 SwiGLU)
10:26
[LLMs 实践] 18 llama2 源码分析 RoPE 相对位置编码的复数形式
12:05
[LLMs 实践] 19 llama2 源码分析 RoPE apply_rotary_emb 从绝对位置编码到相对位置编码
15:27
[LLMs 实践] 20 llama2 源码分析 cache KV(keys、values cache)加速推理
14:10
[LLMs 实践] 21 llama2 源码分析 GQA:Grouped Query Attention
07:34
[LLMs 实践] 221 llama2 源码分析 generate 的完整过程
26:55
[personal chatgpt] trl reward model 与 RewardTrainer(奖励模型,分类模型)
18:36
[personal chatgpt] peft LoRA merge pipeline(lora inject,svd)
20:44
[personal chatgpt] LLAMA 3 整体介绍(与 LLama 2 的不同?)
19:54
[personal chatgpt] gpt-4o tokenizer 及特殊中文tokens(压缩词表),o200k_base
10:00
[personal chatgpt] trl rlhf PPOTrainer,原理分析与代码走读(OpenRLHF framework)
26:46
[personal chatgpt] 从 RoPE 到 CoPE(绝对位置编码,相对位置编码,Contextual Position Encoding)
26:33
[personal chatgpt] Llama2 7B vs. Llama3 8B (词表、attention 及 mlp)
19:10
[personal chatgpt] instructGPT 中的 reward modeling,概率建模与损失函数性质
22:47
客服
顶部
赛事库 课堂 2021拜年纪