牛逼！竟然用3天一口气学完强化学习【PPO、Q-learning、DQN、A3C】十大算法原理及实战玩转超级马里奥！通俗易懂，比啃书强太多了！机器学习|深度学习_哔哩哔哩_bilibili

投稿

coward咿呀咿发消息

大家好，一名工作多年的AI算法工程师，行走在发布人工智能优质学习资源与干货教程道路上的万能叮当猫！

1.【基础】-一张图通俗解释强化学

04:51

机器学习实战项目推荐-机器学习漫画书PDF

01:09

2.【基础】-强化学习的指导依

07:09

3.【基础】-强化学习AI游戏DEM

04:49

4.【基础】-应用领域简

06:29

5.【基础】-强化学习工作流

05:49

6.【基础】-计算机眼中的状态与行

07:26

7.【PPO算法】-基本情况介绍

11:19

8.【PPO算法】-与环境交互得到所需数据

08:31

9.【PPO算法】-要完成的目标分析

10:42

10.【PPO算法】-策略梯度推导

09:02

11.【PPO算法】-baseline方法

06:12

12.【PPO算法】-OnPolicy与OffPolicy策略

07:45

13.【PPO算法】-importance sampling的作用

08:32

14.【PPO算法】-PPO算法整体思路解析

09:21

15.【PPO实战】-Critic的作用与效果

10:41

16.【PPO实战】-PPO2版本公式解读

11:47

17.【PPO实战】-参数与网络结构定义

08:05

18.【PPO实战】-得到动作结果

07:18

19.【PPO实战】-奖励获得与计算

08:09

20.【PPO实战】-参数迭代与更新

11:04

21.【DQN算法】-算法原理通俗解读

07:13

22.【DQN算法】-目标函数与公式解析

10:08

23.【DQN算法】-Qlearning算法实例解读

07:46

24.【DQN算法】-Q值迭代求解

09:00

25.【DQN算法】-DQN简介

05:08

26.【DQN算法】-整体任务流程演示

05:23

27.【DQN算法】-探索与action获取

07:00

28.【DQN算法】-计算target值

05:18

29.【DQN算法】-训练与更新

08:13

30.【DQN算法】-DoubleDqn要解决的问题

06:48

31.【DQN算法】-DuelingDqn改进方法

06:27

32.【DQN算法】-Dueling整体网络架构分析

08:28

33.【DQN算法】-MultiSetp策略

03:46

34.【DQN算法】-连续动作处理方法

08:24

35.【AC算法】-AC算法回顾与知识点总结

07:19

36.【AC算法】-优势函数解读与分析

07:14

37.【AC算法】-计算流程实例

05:51

38.【AC算法】-A3C整体架构分析

06:02

39.【AC算法】-损失函数整理

08:34

40.【项目实战】-整体流程与环境配置

05:39

41.【项目实战】-启动游戏环境

07:01

42.【项目实战】-要计算的指标回顾

09:02

43.【项目实战】-初始化局部模型并加载参数

08:06

44.【项目实战】-与环境交互得到训练数据

09:32

45.【项目实战】-训练网络模型

09:41

持续更新中，敬请期待！！！

00:06

顶部