中分段要不要学临床?
【PPO × Family】第二课:解构复杂动作空间
【PPO × Family】第一课:开启决策 AI 探索之旅
玩个球的贪婪之道-玩个球
MetaBall技术方案分享-MetaBall
【Insight Time】让 AI 走起来!浅谈具身智能中的导航任务
【PPO × Family】第四课:解密稀疏奖励空间
基于引力模型的规则算法-大球球病了二球球瞧
【PPO × Family】第六课:统筹多智能体
数字传奇乘法运算
单智能体规则化决策-球球球
【Insight Time】上海交通大学硕士 Owen 同学带你了解高斯过程如何提升决策智能算法的数据效率
羊群加不进去?那就来加猫群叭!深度强化学习版的羊了个羊来了!
联想研究院AI Lab范伟:AI决策智能技术在联想的实践
【PPO × Family】第三课:表征多模态观察空间
上海人工智能实验室牛雅哲:通用决策AI平台的开拓创新之路
虫王IA回归!带着他的AI——DI-star回来了!
基于分层决策的球球大作战智能体实现-重铸429荣光
GoBigger:多智能体决策智能环境设计分享-OpenDILab核心研发人员张明
上海人工智能实验室刘宇:从感知AI的发展理解决策AI的未来
【PPO × Family】第七课:挖掘黑科技 —— 探秘调优 PPO 的七重境界