强化学习基础 (本科生课程) 北京邮电大学 鲁鹏

4.1万
144
2022-09-05 19:55:26
正在缓冲...
727
540
2483
312
本课程主要介绍强化学习的基础知识,其目标是帮助同学们快速、顺利地进入强化学习及其应用领域的研究工作。课程主要内容包含有限马尔可夫决策过程,动态规划,无模型预测与控制(SASA,Q-Learning),价值函数逼近(DQN),策略梯度方法(REINFORCE),执行者/评论者方法(AC,TRPO,PPO),连续动作空间的确定性策略(DDPG)。
欢迎来到鲁鹏老师实验室下的【官方小站】:CV学吧!(*╹▽╹*) ~ 咱导亲自带咱学计算机视觉嘞!!
自动连播
13.2万播放
简介
第一讲 强化学习介绍
01:33:00
第二讲 马尔可夫决策过程
02:16:40
第三讲 动态规划
01:47:37
4. 无模型预测(评估)
01:22:53
5. 无模型控制(优化)
01:26:41
6. 价值函数近似
01:31:25
7. 策略梯度
01:29:58
客服
顶部
赛事库 课堂 2021拜年纪