为啥杨立昆不看好强化学习?原因是这个。
8年前韩国团队做的demo,和今天的人形机器人公司show的demo也没太大区别,可能把算法换成强化学习或者大模型
强化学习+多目标优化,get到这种思路,发一区TOP就不远了!-人工智能/强化学习
知识蒸馏原理介绍!知识从哪里来怎么蒸馏?十分钟深入浅出弄懂模型蒸馏的原理,简直不要太透彻!
【强化学习+大模型】原来这才是强化学习的正确学习顺序!博士带你用强化学习玩游戏,DQN及PPO算法原理及实战(人工智能自动驾驶/深度强化学习/超级马里奥)
多智能体强化学习编队密集障碍物测试
强化学习真让大模型变聪明了吗?爆肝3篇神作,结论得出来了!【Transformer原作/斯坦福/清华+交大】
[Pybullet] SAC强化学习训练机械臂抓取物体
TPAMI'25超猛料:用因果效应图解释底层视觉模型,打破深度学习“黑盒”!
【李宏毅】2025年最新的强化学习(RL)系列课程!花1小时就能完全入门强化学习,导师不教你的,李教授亲自教会你!人工智能|机器学习|强化学习
AI是理解人类智能的钥匙,Sutton学生万一博士,分享强化学习的应用
为啥杨立昆 不看好 强化学习,原因是这个!
理解大模型推理能力从强化学习开始(七):Q-Learning
强化学习不知道如何入手?211计算机博士精讲强化学习系列主流算法:PPO、Q-learning、DQN、A3C,50集入门到精通!
清华GaussianToken:下一尺度预测+下一标记 ! 高斯助力高效图像Tokenizer
强化学习立大功! DeepMind果蝇登Nature,让「硅基生命」照进现实!
图灵奖得主杨立昆:当前机器学习的状况糟透了,强化学习不告诉答案效率更低
公认深度强化学习(DRL)最顶级教程!伯克利大学王树森教授保姆式教学蒙特卡洛、Sarsa、Q-Learning等算法,比自学效果强多了!
降维打击!何神团队新作彻底颠覆AI生图圈!无需预训练+蒸馏一步到位
一种基于强化学习的摔倒之旅