CodeGeeX是一个具有130亿参数的多编程语言代码生成预训练模型,由清华大学知识工程实验室团队开发,采用华为MindSpore框架实现,在鹏城实验室“鹏城云脑II“平台上使用1536个昇腾910 AI处理器,在20多种语言的语料库上历时两个月预训练得到。CodeGeeX支持多种主流编程语言的高精度代码生成及翻译,在新的多语言基准HumanEval-X取得超过所有开源模型的效果。此外,基于CodeGeeX开发的免费VS Code插件,能更好辅助广大程序员进行开发。本次报告将详细介绍CodeGeeX背后的技术原理、实现过程,以及自动编程插件的使用教程等。
模型及插件链接:https://models.aminer.cn/codegeex/