人工智能框架作为软件根技术,已成为加速人工智能大模型开发、推动产业智能化发展的核心力量。3月22日, 以“为智而昇,思创之源”为主题的昇思人工智能框架峰会2024在北京国家会议中心举办,旨在汇聚AI产业界创新力量,推动根技术持续创新,共建人工智能开源新生态。
格灵深瞳作为昇思开源理事会成员受邀参加本次活动,格灵深瞳研发总监潘玉峰在「昇思MindSpore产学研融合创新与应用论坛2024」上发表了题为《视觉大模型在各行业的创新与应用》的主题演讲。
潘玉峰表示,预训练大模型虽然带来了算法层面的新变革,但同时也引入了一系列的工程化问题。一方面预训练大模型对算力提出了更高的要求,并且要求基础设施的迭代能随时应对业务的需求,另一方面算力的堆叠不等同于性能的提升,而且因为AI算力成本较高,需要尽可能地榨干性能,以期得到充分的利用。因此,我们需要思考如何更高效地进行敏捷开发,同时减弱与业务强耦合的工具开发。
而昇思MindSpore作为国内主流开源框架,可以让开发者更灵活地实现大模型创新,帮助我们加速大模型应用规模落地。潘玉峰提到,昇思MindSpore 加速了大规模预训练模型的训练过程,提供了更稳定的算力基础设施、更高的训练性能以及更高的开发效率。
格灵深瞳使用 MindSpore 框架高效完成了预训练大模型的开发和调试,并在华为的训练卡上完成了训练;此外,我们基于 MindSpore 框架针对业务需求对预训练模型进行了微调后,可以为客户提供适配到目标业务场景的模型;与此同时,MindSpore Lite极大简化了推理工程化,借助 MindSpore Lite优化过的 kernel 算子,在各算力平台上实现了高吞吐、低时延的功耗推理,帮助我们提高了交付效率,加速了业务落地。
目前,格灵深瞳自研的大模型方案已经在智慧金融等领域落地实践,可为客户提供高效的模型生产、高精度的算法能力和安全可靠的国产化解决方案。模型应用了先进的多模态弱监督学习技术,可大大降低数据标注的成本,在少量样本学习场景中,能显著提升模型精确度,并拥有出色的零样本泛化能力,轻松实现模型的冷启动。同时,借助自主学习方案,用户可迅速用行业数据进行模型微调,打造满足特定行业需求的垂直行业大模型。