近日,沐曦集成电路(上海)有限公司(下称“沐曦”)曦云C500千亿参数AI大模型训练及通用计算GPU与北京智谱华章科技有限公司(下称“智谱AI”)开源的中英双语对话语言模型ChatGLM2-6B完成适配。测试结果显示,曦云C500在智谱AI的升级版大模型上充分兼容、高效稳定运行。
沐曦旗舰产品曦云C500基于自主研发的高性能GPU IP,特别适合千亿参数AI大模型的训练和推理;基于全自研 GPU 指令集打造的MXMACA软件栈,全面兼容主流GPU生态,实现用户零成本迁移;通过自主知识产权的MetaXLink实现单机8卡GPU全互联,提供构建高密度算力和云计算部署的优秀国产GPU解决方案;可广泛应用于千亿参数AI大模型训练与推理、AIGC内容生成、推荐系统、自动语音识别、语音合成、图像分割检测,以及科学计算、数据库加速等多种场景。
由清华技术成果转化的智谱AI推出的双语对话模型ChatGLM2-6B在初代模型ChatGLM-6B基础上做了升级,采用监督微调、反馈自助和人类反馈强化学习等方式,能够生成符合人类偏好的答案。通过此次联合适配测试,依托曦云C500运行的ChatGLM2-6B可节省大量时间成本和运营成本,降低硬件接入AI模型训练和推理的门槛,为国产大模型提供强大的算力支撑。未来双方将共同探索国产GPU大模型训推一体机在各个行业的应用,携手打造软硬件一体化解决方案,让企业可以在国产自主创新的平台上实现自主、安全、可控的大模型应用和迭代。
关于沐曦
沐曦致力于为异构计算提供安全可靠的GPU芯片及解决方案,打造全栈GPU芯片产品,推出曦思N系列GPU用于AI推理,曦云C系列GPU用于千亿参数AI大模型训练及通用计算,以及曦彩G系列GPU用于图形渲染,满足数据中心对“高能效”及“高通用性”的算力需求。沐曦产品均采用完全自主研发的GPU IP,拥有完全自主的指令集和架构,配以兼容主流GPU生态的完整软件栈(MXMACA),具备高能效和高通用性的天然优势,能够为客户构建软硬件一体的全面生态解决方案,是“双碳”背景下推动数据中心建设和产业数字化、智能化转型升级的算力基石。