推理系统架构和Trition架构介绍!【推理系统】系列04篇

5315
11
2023-01-11 12:16:36
138
63
66
11
【推理系统】系列04篇:推理系统架构和Trition架构介绍! 要了解整体推理系统架构之前需要明确推理、部署、服务化之间的区别和差异,有了基础的概念后,我们会一起深入了解推理系统架构,而推理系统架构又以NVIDIA Trition作为经典架构例子,深入剖析其架构逻辑;最后AI推理系统重,模型生命周期管理尤为重要,因此单独给大家进行汇报。
昇腾招人,已经毕业的快联系鸭

回归搜索的本质!没有广告,直达结果!

4.0万播放 icon 简介
《推理系统》推理系统是本分享的重点概述,推理就是在训练好的模型结构和参数基础上,执行前向传播得到模型输出的过程。相对于训练而言,推理不涉及梯度和损失优化。推理的最终目标是将训练好的模型部署生产环境中,真正让 AI 能够运用起来。推理引擎可以将深度学习模型部署到云(Cloud)端或者边缘(Edge)端,并服务用户的请求。模型训练过程好比是传统软件工程中的代码开发的过程,而开发完的代码势必要打包,部署给用户使用,那么推理系统就负责应对模型部署的生命周期中遇到的挑战和问题。
01 推理系统内容介绍
08:23
02 什么是推理系统
17:03
03 推理流程全景
12:55
04 推理系统架构
14:25
05(上) 推理引擎架构
12:47
05(下) 推理引擎架构
14:15
客服
顶部
赛事库 课堂 2021拜年纪