【RLChina 2022】理论课三:强化学习基础 张伟楠
【RLChina 2022】理论课二:博弈论基础 张海峰
【RLChina 2022】专题报告一:多智能体强化学习 张崇洁
【RLChina 2021】第5课 强化学习入门(一) 张伟楠
【RLChina 2022】实践课五:离线强化学习算法 秦熔均
【RLChina 2022】理论课一:机器学习和深度学习基础 陈旭
【RLChina 2022】前沿进展七:深度强化学习的若干前沿方向 柯良军
【RLChina论文研讨会】第53期 曾兰婷 基于强化学习控制的低碳电力系统安全性研究
【RLChina 2022】专题报告四:决策大模型 汪军
【RLChina 2022】前沿进展五:应用多智能体强化学习解决现实问题——机遇和挑战 方飞
【RLChina 2023】 专题报告三:强化学习与语言大模型的一些共通点 俞扬
【RLChina 2021】第9课 强化学习前沿(一) 卢宗青
【RLChina 2022】实践课四:基于种群的学习 温颖
理解大模型推理能力从强化学习开始(一):马尔可夫奖励过程(代码仿真)
【强化学习+大模型】原来这才是强化学习的正确学习顺序!博士带你用强化学习玩游戏,DQN及PPO算法原理及实战(人工智能自动驾驶/深度强化学习/超级马里奥)
【RLChina 2022】前沿进展三:演化强化学习的研究与应用 郑岩
【RLChina论文研讨会】第34期 马一宁 解决车辆路径问题的深度强化学习方法:近期发展及挑战
【RLChina 2024】讲习班01 汪军 Machine Learning Walkthrough
【RLChina 2021】第6课 强化学习入门(二) 杨林
【RLChina论文研讨会】第90期 李英儒 Q* meets Thompson Sampling:Scaling up Exploration via Hyp