牛逼!竟然用3天一口气学完强化学习【PPO、Q-learning、DQN、A3C】十大算法原理及实战玩转超级马里奥!通俗易懂,比啃书强太多了!机器学习|深度学习

2699
关注
正在缓冲...
00:00 / 00:00
自动
    倍速
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    100
    更多播放设置
    播放方式
    视频比例
    其他设置
    -人正在看
    已装填 0 条弹幕
    自动平衡不同视频间的音量大小
    平衡音量同时保留更多声音细节
    关闭音量均衡
    开启画中画
    宽屏模式
    网页全屏
    进入全屏 (f)
    关闭弹幕 (d)
    视频底部15%部分为空白保留区
    特殊颜色、运动形式的弹幕
    反馈
      47
      30
      150
      36
      配套源码+数据集打包放在【公-棕-耗:AI技术星球,回-复-暗-号:44, 即-可-精-准-获-取-学-习】 强化学习是一种机器学习方法,其中智能体通过与环境进行交互,根据环境返回的状态采取动作,并接收延迟的奖励(对前一步动作的评估)来更新其知识,以学习最优的行为策略。常见的强化学习算法有:Q-learning算法、SARSA算法、深度Q网络(DQN)、深度确定性策略梯度(DDPG)。强化学习在游戏、机器人控制、自动驾驶、自然语言处理等领域都有广泛的应用
      大家好,一名工作多年的AI算法工程师,行走在发布人工智能优质学习资源与干货教程道路上的万能叮当猫!
      弹幕列表
      弹幕列表
      屏蔽设定
      高级弹幕
      弹幕列表填充中...
      视频选集
      (1/47)
      自动连播
      1.【基础】-一张图通俗解释强化学
      04:51
      机器学习实战项目推荐-机器学习漫画书PDF
      01:09
      2.【基础】-强化学习的指导依
      07:09
      3.【基础】-强化学习AI游戏DEM
      04:49
      4.【基础】-应用领域简
      06:29
      5.【基础】-强化学习工作流
      05:49
      6.【基础】-计算机眼中的状态与行
      07:26
      7.【PPO算法】-基本情况介绍
      11:19
      8.【PPO算法】-与环境交互得到所需数据
      08:31
      9.【PPO算法】-要完成的目标分析
      10:42
      10.【PPO算法】-策略梯度推导
      09:02
      11.【PPO算法】-baseline方法
      06:12
      12.【PPO算法】-OnPolicy与OffPolicy策略
      07:45
      13.【PPO算法】-importance sampling的作用
      08:32
      14.【PPO算法】-PPO算法整体思路解析
      09:21
      15.【PPO实战】-Critic的作用与效果
      10:41
      16.【PPO实战】-PPO2版本公式解读
      11:47
      17.【PPO实战】-参数与网络结构定义
      08:05
      18.【PPO实战】-得到动作结果
      07:18
      19.【PPO实战】-奖励获得与计算
      08:09
      20.【PPO实战】-参数迭代与更新
      11:04
      21.【DQN算法】-算法原理通俗解读
      07:13
      22.【DQN算法】-目标函数与公式解析
      10:08
      23.【DQN算法】-Qlearning算法实例解读
      07:46
      24.【DQN算法】-Q值迭代求解
      09:00
      25.【DQN算法】-DQN简介
      05:08
      26.【DQN算法】-整体任务流程演示
      05:23
      27.【DQN算法】-探索与action获取
      07:00
      28.【DQN算法】-计算target值
      05:18
      29.【DQN算法】-训练与更新
      08:13
      30.【DQN算法】-DoubleDqn要解决的问题
      06:48
      31.【DQN算法】-DuelingDqn改进方法
      06:27
      32.【DQN算法】-Dueling整体网络架构分析
      08:28
      33.【DQN算法】-MultiSetp策略
      03:46
      34.【DQN算法】-连续动作处理方法
      08:24
      35.【AC算法】-AC算法回顾与知识点总结
      07:19
      36.【AC算法】-优势函数解读与分析
      07:14
      37.【AC算法】-计算流程实例
      05:51
      38.【AC算法】-A3C整体架构分析
      06:02
      39.【AC算法】-损失函数整理
      08:34
      40.【项目实战】-整体流程与环境配置
      05:39
      41.【项目实战】-启动游戏环境
      07:01
      42.【项目实战】-要计算的指标回顾
      09:02
      43.【项目实战】-初始化局部模型并加载参数
      08:06
      44.【项目实战】-与环境交互得到训练数据
      09:32
      45.【项目实战】-训练网络模型
      09:41
      持续更新中,敬请期待!!!
      00:06
      客服
      顶部
      赛事库 课堂 2021拜年纪