DeepSeek-V3 技术报告的细节解读
4K | 本地部署DeepSeek-R1后,搭建自己的知识库
2025一定要学的DeepSeek教程!1小时彻底搞懂(全满血本地部署+测评+知识库搭建+使用技巧)——ai大模型/LLM/大模型学习路线/Propmt
DeepSeek的核心技术之一多头潜在注意力机制(MLA)
DeepSeek-R1核心算法GRPO讲解-从强化学习0基础->PPO->GRPO
19、Transformer模型Encoder原理精讲及其PyTorch逐行实现
Deepseek系列论文2.3:多头潜在注意力机制 MLA(Multi-Head Latent Attention)
为什么神经网络可以学习任何东西?首次使用动画讲解,带你吃透神经网络!(CNN卷积神经网络、RNN循环神经网络、GAN生成式对抗网络、人工智能、AI)
抛弃手动回复!我让DeepSeek帮我回复微信消息
直接带你把Transformer手搓一遍,这次总能学会Transformer了吧!
【7】Flash Attention 原理讲解
DeepSeek大师课程: 从入门到精通
【强化学习的数学原理】课程:从零开始到透彻理解(完结)
【5】手写 Train.py 大模型代码逻辑
deepseekv3 全网最硬核解读三 dualpipe
DeepSeek R1核心原理讲解 | 在开放语言模型中推动数学推理的极限 (论文解析)
【DeepSeek面试系列】讲一下DeepSeek的MLA注意力,它为什么要这样改进?
【动手学Agent】FunctionCall 如何使用以及如何训练,以及和 MCP 的关系
国产AI大模型 DeepSeekV3 核心技术详解!DeepSeek训练方法便宜在哪?MLA是什么?MoE技术会成为大模型的主流技术?大模型微调
从零开始的Huggingface保姆级教程!吴恩达老师带你3小时吃透!怎么会讲得如此通俗易懂,太猛了!