从图像到语言,从语言到推理:生成AI正在闭环. AI图像生成的最终形态曝光:图、文、动作,一起生!

843
0
2025-04-20 21:32:47
正在缓冲...
34
12
19
6
-
牛粪博士带你拆AI,不装不吹,笑着把技术讲透! 科研严肃,拆解有趣,AI知识也可以通俗又上头!
《AI拆解术》
(35/85)
自动连播
18.6万播放
简介
AI的未来,我们为什么需要更灵活的计算?:encoder-only/decoder-only/encoder-decoder,并聊聊他们的问题和发展方向
03:22
"爸爸,AI为什么比你更懂我的画?"——视觉技术的未来
02:29
AI 预言家?GPT 为什么能一口气接下你的话!聊聊GPT的那些事。
04:48
大模型强化学习,原来是“脱了鞋子跑得快?!” 聊聊Open-Reasoner-Zero.
04:15
BERT 防秃指南:学 AI 到底能不能保住头发?
03:58
AI 视觉生成进入换代期,Diffusion 退潮,AR 只是过渡方案?
01:12
码农崩溃2.0:我女儿竟然听懂了视觉 Tokenizer?!
07:15
DeepSeek NSA推理速度提升11.6倍,Nvidia要哭了?
08:30
Transformer 要下岗了?AI 未来架构全揭秘!Transformer 统治 AI 7 年,但它的终结者来了? 我们今天就来拆解现状 + 未来趋势!
06:36
《AI拆解术》之Step-Audio语音界的DeepSeek?聊聊audio大模型的困境和发展方向
07:45
《AI拆解术》之剧本杀:Attention密室连环杀人案
07:19
《AI拆解术》之程序员崩溃现场:我女儿竟然听懂了tokenizer
04:28
《AI拆解术》系列作品即将上线,敬请关注
00:12
聊聊多模态大模型的瓶颈
05:03
聊聊diffusion扩散模型的问题
05:08
AI 画画离谱到家了?Diffusion 竟然不懂艺术!聊聊扩散模型的原理,存在的问题和未来发展方向
04:45
AI写字为啥这么困难?视觉生成任务任重道远。聊聊扩散模型在生成字符方面的不足。
02:50
别怪AI在撒谎,是你教它这样的!——深扒损失函数如何操控AI与人类
02:08
聊聊大模型的幻觉(hallucination)问题,深度思考它的问题和意义。
03:40
聊聊多模态模型为啥还没到GPT时刻,分析它的问题和未来发展趋势。
03:40
Diffusion 控不住,是因为它根本不理解你要控制什么?再聊diffusion的局部控制性问题和发展方向
02:54
聊聊多模态大模型的问题&浅谈世界模型
01:57
什么是世界模型?AI 的“内心戏”来了
01:57
分形模型,结构控制的破局者?Diffusion救不回来的视频,分形模型来接手了?
02:29
Diffusion LLM 是什么?也许不是更好,但确实不同。除了自回归,我们还有 Diffusion 这条路。
02:06
推理增强奖励建模:DeepSeek的新范式;读《Inference-Time Scaling for Generalist Reward Modeling》论文
02:23
AI是怎么思考的?Anthropic团队可视化大揭秘!
03:05
为什么基于 Diffusion 的图像编辑总是“动全身”?从噪声开始,也要从噪声改:Diffusion 模型编辑的根本困境。
02:08
图像编辑革命:AR 模型如何干掉 Inversion?AR 模型如何实现真正的 Training-Free 图像编辑?
02:59
图像编辑范式转移:从 noise 到 token 的革命。Diffusion 生成图像,AR 修改图像——谁才是编辑的终极解法?
03:04
图像生成进入语言时代,AR 重塑视觉建模逻辑.
02:54
看完你才懂,AR 模型“讲图”的三种打开方式!AR视觉生成三大流派,一次讲清:VAR、RandAR、FAR 各走哪条路?
03:00
图像终于学会“说话”了,它的词就是 Token。什么样的 Token,才能撑起通用视觉生成系统?
02:29
从随机扩散到因果建模:图像生成控制力的底层差异。
02:32
从图像到语言,从语言到推理:生成AI正在闭环. AI图像生成的最终形态曝光:图、文、动作,一起生!
02:11
图像+语言+动作:未来AI的大脑是这样炼成的
02:33
统一世界的AI词汇,长啥样?聊聊AI的共同语言革命。
03:53
从结构到目标:多模态融合的真矛盾在哪里?多模态结构只是外壳,目标冲突才是根源
03:10
多模态生成崩坏的根源:缺乏语义驱动器
03:46
多模态统一的终极挑战:从模态融合,到世界建构
03:17
生成自由度的代价,就是控制失控。怎么办?从自由生成到结构控制
03:07
自由生成之后,必然走向幻觉与漂移;从生成到觉醒:智能体的最后一跃
02:54
算法推荐 vs 主动搜索:谁在左右你的选择?深度解析算法推荐与检索系统的差异及影响
02:44
别再说“它太懂我了”,那是你被驯化了!推荐系统的底层逻辑:不是理解,是训练。
02:22
冷启动惩罚、CTR排序、曝光偏置,一套机制悄悄决定你看不见什么;推荐系统最可怕的不是推什么,而是不推什么。
02:00
大模型很强,但它接不了推荐系统的班;聊聊大模型在推荐系统里的弊端和潜力
02:22
推荐系统拥抱大模型,还是坚持Embedding?Embedding是骨架,大模型只是插件
02:32
大模型不会替代推荐系统,但会重构它.
01:58
大模型冷启动只解决了一半,另一半靠设计
03:43
聊聊推荐系统的难题:记忆力 vs 反应力
03:25
内容分发不是自由市场,而是分层选拔
02:27
广告推荐系统的底层逻辑,不适配大模型:聊聊大模型与广告系统的结构性矛盾
02:25
为什么大模型做不了主决策,却能辅助投放?
02:45
大模型要接管广告系统,得先补这三块短板
02:51
从关键词匹配到RAG,大模型改造了检索系统
02:49
大模型需要RAG,但RAG还不够强:看清它解决了什么,又留了哪些坑
02:58
RAG系统怎么设计,才能查得准,答得好?
02:41
提升RAG命中率的3种方法
02:43
RAG该进化了:RAG未来靠“信息重组”,不是“语义抓取”
02:48
多模态RAG,图文音齐了,模型还答不对?
02:26
多模态RAG检索,要先统一任务目标
02:59
Agent RAG:不是补RAG的短板,是重构。Agent RAG,才是下一代检索系统
03:17
Agent RAG 的终极能力:查出结构,不是堆材料
02:34
从结构到状态,Agent 的执行力升级:任务长了不迷路,才算真智能
03:18
Agent 能复用经验,系统越跑越快;真正聪明的 Agent,是查一次学一次
03:02
真正的 Agent,不止会查,还能判断与调度
03:00
一个调度器,多个专家,Agent 正在进化成团队
03:03
没有任务状态共享,Agent 越多越混乱;多 Agent 协作的关键,不在能力,在状态同步
03:01
有策略记忆的 Agent,才配叫下一代智能体
02:41
从chain of thought学习agent:基础篇
01:52
ReAct的本质就是走一步看一步,灵活但短视
02:02
Plan-and-Execute:为什么有些任务,必须“先想完再动”?
01:53
Memory 是 Agent 真正能“成长”的关键
02:06
从盲试到自学,Reflexion 是 Agent 的关键升级路径
01:56
Tool Use 决定了 Agent 能走多远,不是参数决定的
02:48
MCP开篇:聊聊RAG和MCP的区别
01:48
MCP 是怎么让模型动起来的?聊聊MCP工作原理。
01:55
MCP是AI时代的HTTP?未来操作系统会是什么样子?
02:05
《RL 对齐进化论》系列视频开篇:对齐,不只是强化学习的事
01:54
对齐为啥这么难?违反了机器学习的默认三大假设
03:18
PPO 到底怎么 work?优点和坑都讲清楚
02:20
Reward Model是怎么训练出来的?有什么问题?
02:12
DPO的工作原理和存在的问题
03:01
ORPO:把偏好对齐融进监督微调里
02:39
只靠排序,不靠评分器,SLiC也能对齐大模型?
02:52
客服
顶部
赛事库 课堂 2021拜年纪