大模型实验室大模型开发平台介绍
泰迪科技
编辑于 2024年09月09日 15:39

     大模型开发平台是一款面向高校大模型教学、科研的一站式大模型开发工具。平台能够自定义调用CPU和内存资源,自由配置专门针对大模型和深度学习等任务的硬件加速器(如GPU或XPU),能够高效地执行大模型的prompt工程、大模型应用开发和大模型的微调。

     平台支持主流的大模型基座,支持大模型基座私有化部署,包括智谱的ChatGLM、百川的Baichuan、阿里的Qwen等,助力用户快速进行大模型的开发和微调。平台还提供了丰富大模型开发工具、整套开发环境和资源监控功能,能够灵活分配资源,方便用户轻松使用、开发、管理大模型应用。

    大模型开发平台功能简介

    1、资源看板

    提供资源监控页面,汇总系统的资源配置情况,包括CPU、GPU、内存、节点状态和任务实时数据。

   2、数据存储

   提供上传本地数据资源,支持非结构化数据和通用的表结构化数据,同时提供了数据的下载、重命名、移动和删除功能。支持将数据文件共享至公共存储空间,多用户可以复制和使用相同的数据。

   3、训练任务

    提供简单的界面操作,定义任务的入口程序、算力规格,完成任务创建,可设置定时任务功能,预定任务的启动时间。支持复制已有任务并进行修改,从而提高任务创建的效率。通过查看任务运行日志的功能,包括任务当前的状态、输出信息以及可能的错误提示,判断任务的运行成果。

   4、微调开发

   提供开发环境列表界面可以对单用户的多个开发环境进行管理,点击链接可进入在线JupyterLab开发界面。支持大模型微调,包括Qwen-7B-Chat、chatglm2-6b、vicuna-13b、vicuna-7b、Baichuan2-7B、Baichuan2-13B、RWKV等。

  5、规格管理

  管理员可以根据需要设定CPU和GPU配额,以确保资源的合理分配。支持国产算力卡、GPU、XPU等多种硬件,包括昆仑芯、华为昇腾、天数智芯等,可以根据大模型项目要求选择适合的硬件加速器,以优化性能。

   大模型开发平台特色功能如下:

   (1)提供资源监控页面,用于综合显示系统的资源配置概况,包括CPU、GPU、内存、节点状态以及即时任务数据,轻松了解系统资源的状况和大模型任务的实时执行情况。

   (2)支持多种数据上传,如本地数据资源、非结构化数据或通用的表结构化数据,提供一系列数据管理功能,包括下载、重命名、移动和删除,同时可将数据文件共享至公共存储空间,其余用户可以复制和使用相同的数据。

   (3)创建训练任务时,可以根据计算需求,灵活选择所需的CPU和GPU算力规格以及根据需求设定定时任务,完成任务创建。并提供多种任务管理功能,如查看所有任务、定时启动任务、复制任务、查看任务状态和执行进度、查看日志输出等。

   (4)支持对单用户的多个开发环境进行管理。支持对大模型进行微调,包括Qwen-7B-Chat、chatglm2-6b、vicuna-13b、vicuna-7b、Baichuan2-7B、Baichuan2-13B、RWKV等。支持复制现有的交互开发任务,快速创建相似的任务,省去了重新配置环境的麻烦。支持查看任务的实时状态和进展,以确保任务正常运行。支持随时停止正在运行的开发环境,以释放资源或者结束任务。

   (5)可对CPU和GPU的配额进行设定,管理员可以根据需要,为每个用户或项目设定特定的CPU和GPU配额,确保资源的公平分配,满足不同任务的计算需求。同时,支持多种硬件加速器,包括国产算力卡、GPU、XPU等,涵盖了昆仑芯、华为昇腾、天数智芯等多种硬件。平台可以根据大模型项目要求选择最适合的硬件来优化性能,确保资源的有效利用,提高工作效率和任务执行的成功率,为用户提供最佳的计算体验。