强烈推荐!【北大王树森】6小时学会深度强化学习!数学基础/多智能体强化学习/策略学习/深度学习

3.2万
219
2023-02-15 17:31:34
正在缓冲...
367
149
1534
236
王树森 白嫖课程配套学习资料+60G入门到进阶精选资料包! 更有:计算机博士公开课免费观看名额、论文指导、简历指导、竞赛指导、技术问题解答! 关注公众H:AI技术星球 回复211 获取 1、超详细的人工智能学习路线(AI大神博士推荐的学习地图) 2、人工智能必看书籍(动手学习深度学习、花书、西瓜书、蜥蜴书AI宝藏电子书这里都有) 3、60份人工智能行业报告(想了解人工智能行业前景就看这!) 4、人工智能快速入门视频教程合集(Python基础、数学基础、机器学习算法与实战、NLP、数据分析等等) 5、上千篇CVPR、ICCV顶会论文 6、唐宇迪博士精心整理的人工智能学习大纲 7、机器学习算法+深度学习神经网络基础教程 8、OpenCV、Pytorch、YOLO等主流框架算法实战教程
视频选集
(13/19)
自动连播
1. (1)深度强化学习基础:基本概念
40:06
2. (2)深度强化学习基础:价值学习
28:12
3. (3)深度强化学习基础:策略学习
22:53
4. (4)深度强化学习基础:Actor-Critic
23:41
5. (5)深度强化学习基础:AlphaGo
53:43
6. (6)数学基础:蒙特卡洛+Monte+Carlo
25:24
7. Sarsa算法_(TD_Learning_1_3)
10:56
8. Q-Learning算法+(TD+Learning+2_3)
08:33
9. Multi-Step+TD+Target+(TD+Learning+3_3)
06:36
10. 经验回放+Experience+Replay+(价值学习高级技巧+1_3)
14:19
12. Dueling+Network+(价值学习高级技巧+3_3)
15:11
13. 多智能体强化学习(1_2):基本概念++Multi-Agent+Reinforcement+Learning
18:37
15. 策略梯度中的Baseline+(1_4)
09:48
16. REINFORCE+with+Baseline+(策略梯度中的Baseline+2_4)
11:26
17. A2C+方法+(策略梯度中的Baseline+3_4)
18:46
18. REINFORCE与A2C的异同+(策略梯度中的Baseline+4_4)
07:44
19. 离散控制与连续控制+(连续控制+1_3)
04:22
20. 确定策略梯度+Deterministic+Policy+Gradient,+DPG+(连续控制+2_3)
15:50
21. 随机策略做连续控制+(连续控制+3_3)
20:33
客服
顶部
赛事库 课堂 2021拜年纪