太强了!完全可以用100集教程搞懂强化学习六大核心算法,一口气学完Q-Learning、DQN、PPO、DPO等算法的原理+实操!机器学习|深度学习|计算机视觉

1480
32
2025-07-01 10:53:45
40
44
70
17
强化学习(Reinforcement Learning,RL)是一种机器学习方法。近年来,强化学习在多个领域取得了显著进展,尤其是在游戏、机器人、推荐系统和自然语言处理等领域。例如,AlphaGo利用深度学习和强化学习技术在围棋游戏中战胜了世界冠军,展示了强化学习在解决复杂问题上的巨大潜力。 强化学习算法包含以下这些 一、马尔可夫过程算法 二、DDPG算法 三、Q-learning算法 四、Actor-Critic算法 五、最大熵算法 六、PPO算法 七、演员-评论家算法 八、Sarsa算法
籽料放在公棕耗:AI技术星球,发824,即可精准拿到本账号的所有源码+笔记
视频选集
(1/45)
自动连播
1.人工智能入门到进阶学习路线方向
01:35
2.【基础】-强化学习的指导依
07:08
3.【基础】-强化学习AI游戏DEM
04:49
4.【基础】-应用领域简
06:29
5.【基础】-强化学习工作流
05:49
6.【基础】-计算机眼中的状态与行
07:26
7.【PPO算法】-基本情况介绍
11:18
8.【PPO算法】-与环境交互得到所需数据
08:31
9.【PPO算法】-要完成的目标分析
10:41
10.【PPO算法】-策略梯度推导
09:02
11.【PPO算法】-baseline方法
06:12
12.【PPO算法】-OnPolicy与OffPolicy策略
07:45
13.【PPO算法】-importance sampling的作用
08:32
14.【PPO算法】-PPO算法整体思路解析
09:21
15.【PPO实战】-Critic的作用与效果
10:40
16.【PPO实战】-PPO2版本公式解读
11:47
17.【PPO实战】-参数与网络结构定义
08:05
18.【PPO实战】-得到动作结果
07:18
19.【PPO实战】-奖励获得与计算
08:09
20.【PPO实战】-参数迭代与更新
11:04
21.【DQN算法】-算法原理通俗解读
07:13
22.【DQN算法】-目标函数与公式解析
10:08
23.【DQN算法】-Qlearning算法实例解读
07:46
24.【DQN算法】-Q值迭代求解
09:00
25.【DQN算法】-DQN简介
05:08
26.【DQN算法】-整体任务流程演示
05:22
27.【DQN算法】-探索与action获取
07:00
28.【DQN算法】-计算target值
05:18
29.【DQN算法】-训练与更新
08:13
30.【DQN算法】-DoubleDqn要解决的问题
06:48
31.【DQN算法】-DuelingDqn改进方法
06:27
32.【DQN算法】-Dueling整体网络架构分析
08:28
33.【DQN算法】-MultiSetp策略
03:46
34.【DQN算法】-连续动作处理方法
08:24
35.【AC算法】-AC算法回顾与知识点总结
07:19
36.【AC算法】-优势函数解读与分析
07:14
37.【AC算法】-计算流程实例
05:51
38.【AC算法】-A3C整体架构分析
06:02
39.【AC算法】-损失函数整理
08:33
40.【项目实战】-整体流程与环境配置
05:39
41.【项目实战】-启动游戏环境
07:01
42.【项目实战】-要计算的指标回顾
09:02
43.【项目实战】-初始化局部模型并加载参数
08:06
44.【项目实战】-与环境交互得到训练数据
09:32
45.【项目实战】-训练网络模型
09:40
客服
顶部
赛事库 课堂 2021拜年纪