【RLChina 2021】第7课 强化学习进阶(一) 杨卓然
【RLChina 2022】理论课三:强化学习基础 张伟楠
【RLChina 2022】理论课四:强化学习的直接法与间接法 李升波
【RLChina 2021】第5课 强化学习入门(一) 张伟楠
【RLChina 2022】前沿进展二:强化学习在金融决策里的应用 徐任远
【RLChina 2022】专题报告四:决策大模型 汪军
【RLChina 2022】实践课五:离线强化学习算法 秦熔均
【RLChina 2022】前沿进展七:深度强化学习的若干前沿方向 柯良军
【RLChina论文研讨会】第67期 张钰荻 强化学习中可解释的奖励重新分配:一种因果角度方法
【RLChina论文研讨会】第53期 曾兰婷 基于强化学习控制的低碳电力系统安全性研究
【RLChina 2022】实践课三:强化学习算法 田政
【强化学习+大模型】原来这才是强化学习的正确学习顺序!博士带你用强化学习玩游戏,DQN及PPO算法原理及实战(人工智能自动驾驶/深度强化学习/超级马里奥)
【RLChina论文研讨会】第58期 王锡淮 Order Matters:Agent-by-agent Policy Optimization
【RLChina 2021】第6课 强化学习入门(二) 杨林
【RLChina论文研讨会】第34期 马一宁 解决车辆路径问题的深度强化学习方法:近期发展及挑战
为啥杨立昆不看好强化学习?原因是这个。
【RLChina论文研讨会】第87期 林越 多智能体强化学习中的信息设计
【RLChina论文研讨会】第45期 穆尧 AdaptDiffuser:Diffusion Models as Adaptive Self-evolving
【RLChina 2024】讲习班22 温颖 具身智能:机器人学习视角
【RLChina 2022】前沿进展六:Distributed AI Scalability, Efficiency, and Generalizability