【RLChina 2022】理论课三:强化学习基础 张伟楠
【RLChina 2022】理论课二:博弈论基础 张海峰
【RLChina 2022】专题报告一:多智能体强化学习 张崇洁
【RLChina 2022】前沿进展二:强化学习在金融决策里的应用 徐任远
【RLChina 2022】实践课一:PyTorch入门 宋研
【RLChina 2022】专题报告二:贝叶斯优化 汪军、Rasul Tutunov
【RLChina 2022】实践课四:基于种群的学习 温颖
【RLChina 2022】实践课五:离线强化学习算法 秦熔均
【RLChina 2021】第8课 强化学习进阶(二) 汪军
【RLChina 2021】习题课2 林舒
【RLChina 2024】讲习班12 林舒 Game Theory
【RLChina 2021】第2课 机器学习进阶 张景昭
【RLChina 2022】前沿进展七:深度强化学习的若干前沿方向 柯良军
【RLChina 2022】前沿进展三:演化强化学习的研究与应用 郑岩
【RLChina 2021】第11课 多智能体入门(一) 杨耀东
【RLChina 2022】前沿进展十:Fully Decentralized Multi-Agent RL 卢宗青
【RLChina 2020】第11讲 Advances of Multi-agent Learning
理解大模型推理能力从强化学习开始(一):马尔可夫奖励过程(代码仿真)
为啥杨立昆不看好强化学习?原因是这个。
【RLChina 2024】讲习班22 温颖 具身智能:机器人学习视角