在日前举办的2024 vivo开发者大会上,vivo高级副总裁、首席技术官施玉坚表示,在过去三年和今年前三季度,vivo始终稳居国产手机销量第一。去年,vivo推出了自己的技术品牌——“蓝科技”。蓝科技是从应用创新扎根到底层技术创新,从硬件驱动到形成软硬件一体化能力,这是vivo基于用户需求,所构建的技术研发体系。其包含了“蓝图影像”、“蓝海续航系统”、“蓝晶芯片技术栈”以及全新升级的“蓝心大模型”和“蓝河操作系统”。
在此次大会上,vivo正式发布全新AI战略——“蓝心智能”,同时带来全面升级的自研蓝心大模型矩阵、原系统5(OriginOS 5)、蓝河操作系统2(BlueOS 2)等等。
早在去年,端侧AI便成为各大手机终端厂商进行手机创新的主航道,彼时大家都将AI端侧大模型的参数集中于7B。然而参数越大所需的处理器、存储等资源越多,轻量化小模型或许更适合于智能终端,但是否AI性能会打折扣呢。vivo最新推出的3B小模型给出了答案。
正如vivo对于蓝心大模型的定位是,通过丰富中文数据与知识的供给,把蓝心大模型做成最懂中国人的大模型。我们可以看到,无论是中文诗句的文生图、方言的采集与支持等等,vivo的一系列底层技术的创新是实实在在践行这一定位,并将智能手机AI带到一个新的阶段。
蓝晶芯片技术栈升级,“天玑芯,看蓝晶”
vivo一直专注SoC从定义、设计到研发调校的全链路技术闭环,实现底层的“软硬一体化”设计,为芯片注入“vivo的灵魂”。
近年来,联发科技发布的旗舰芯片,均由vivo旗舰手机首发搭载。随着双方合作的持续深化,vivo蓝晶芯片技术栈也积累了强大的芯片调校经验,软硬一体化打造最强综合能效体验,并在业界有了“天玑调校看蓝厂”、“天玑芯,看蓝晶”等美誉。
vivo X200系列将全球首发搭载天玑9400,vivo蓝晶芯片技术栈深度调校,带来“冲动又冷静”的最强综合能效体验。
天玑9400的第二代全大核CPU架构包含1个主频高达3.62GHz的Cortex-X925超大核,以及3个Cortex-X4超大核和4个Cortex-A720大核,其单核性能相较上一代提升35%,多核性能提升28%。天玑9400采用台积电第二代3nm制程,相较上一代同性能功耗降低40%。与此同时,天玑9400搭载新一代旗舰12核GPU Immortalis-G925,其峰值性能相较上一代提升 41%,功耗节省44%,光线追踪性能较上一代提升40%,游刃有余的性能将大幅提升游戏沉浸感。
vivo蓝晶芯片技术栈的深度调校,在进一步激发天玑9400强悍性能的同时,也实现了更优秀的能耗控制,达到高能效与低能耗的完美平衡。根据vivo产品经理韩伯啸发布的截图显示,搭载天玑9400的vivo X200系列,在安兔兔平台跑出超300万分的历史新高,再次树立安卓旗舰手机的性能标杆。
vivo全新AI战略“蓝心智能”:AI与OS的深度融合
在此次大会上,vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围正式发布了vivo的全新AI战略——蓝心智能。
蓝心智能是将大模型技术与手机操作系统深度融合的个人智能。蓝心智能可以理解用户的个人情景和偏好,为用户提供个人化的专属服务。
vivo从三个方面用AI重构系统体验。包括重构人与设备的交互体验,让交互更自然更符合直觉。重构人与数字世界的服务体验,让智能更加个人化,也就是构建简单高效的服务获取能力和主动服务能力,从而让手机成为智能温暖的个人助理。还有,重构人与物理世界的连接体验,让沟通更顺畅和温暖。vivo利用多模态大模型,让手机成为视障人士的眼睛,帮助他们可以独自安全的走到更远的陌生的地方。
基于此,vivo基于蓝心大模型技术做出的一次全新探索,即“PhoneGPT”也就是手机智能体。在演示中,蓝心小V不仅可以对屏幕界面进行识别和操作,也可以通过接管音频进行自主对话,以完成用户交代的任务,例如帮助我们去订餐厅、订咖啡等等。这是手机自动化的一小步,却是解放用户双手的一大步。
未来,蓝心智能将以蓝心大模型矩阵为技术底座,继续探索AI与OS的深度融合,持续打造开放共赢的智能体生态。
全新蓝心大模型矩阵,3B端侧大模型打破“不可能三角定律”
为进一步夯实AI能力底座,vivo在今年的开发者大会上发布了全新自研蓝心大模型矩阵。全面升级语言大模型和端侧大模型能力,并带来vivo自研的语音大模型、图像大模型以及多模态大模型。这预示蓝心智能,向着个人化和多元化发展迈出重要的一步。
在去年开发者大会上,vivo 发布了自研十亿、百亿、千亿三个参数量级,由5款语言大模型组成的蓝心大模型矩阵。并在行业中率先跑通了1B、7B、13B的端侧大模型,同时基于蓝心大模型推出了蓝心小V和蓝心千询APP。截至今天,vivo的AI能力已覆盖全球60多个国家和地区,服务超过5亿手机用户,大模型token输出量超过了3万亿个。
继去年带来了三款端侧大模型之后,vivo正式发布全新30亿参数量级的蓝心端侧大模型3B。
图:电子发烧友网现场拍摄
在对话写作、摘要总结、信息抽取等能力上,蓝心3B可以越级比肩行业7B-9B模型。相比蓝心7B,蓝心 3B极致性能提升300%,平衡模式下功耗优化达46%,极致出词速度可以达到80字/s,系统功耗仅450mA,内存占用仅1.4GB。在SuperCLUE和Equal Eval的小模型综合能力评测中,蓝心3B均排名第一,同时获得了泰尔实验室端侧大模型综合能力认证以及AIIA安全防范能力认证。蓝心端侧大模型3B真正打破了“模型小、能力强、消耗低“的不可能三角定律”。
图:电子发烧友网现场拍摄
据了解,vivo X200系列将全球首发LPDDR5X Ultra Pro内存,为用户带去更强悍的手机性能体验。也就是说,采用参数量级更小的模型的同时,内存性能还顶格提升,这为智能手机的AI极致性能体验提供了巨大的空间。从另一方面来自,模型轻量化也有利于端侧AI功能从旗舰手机向中低端智能手机的下放,对AI手机的普及起到至关重要的作用。
云端语言大模型升级方面,BlueLM-70B 2.0新增学习了1亿知识问答,500w篇的论文,以及1.2亿代码仓库等高质量数据,模型整体能力提升30%。新增了多模态多轮对话能力,支持400+手机系统工具和180+三方工具的调用,以及全面升级了大模型的代码生成能力,能实现数理计算和Excel的数据分析能力。
语言大模型新增图像理解能力,通过将文本、图像抽象成统一的token表示,vivo为语言大模型新增了看世界的“眼睛”,能够理解手机上的文字和图片多种模态的信息。BlueLM-V-3B模型,领跑行业4B及以下的多模态大模型。
vivo自研语音大模型基于蓝心文本大模型开发,通过离散化编码结合文本大模型学习,实现更智能、丰富和简单的语音交互。它具备四大核心能力:语音合成、音色复刻、语音翻译和方言自由说。未来,vivo计划将语音大模型能力逐步开放至智能体平台,以更广泛地服务于用户和开发者。
vivo的文生图大模型即蓝心图像大模型BlueLM-Art,精通中文语境,融合了中国特色与东方美学,其在中文理解、中国文化诠释、人物摄影美学及中文文字绘制等多个维度都取得了出色的效果,多次荣登SuperCLUE-Image基准榜单中文领域榜首。
大模型时代,vivo持续推进各模态大模型端侧化能力建设,探索大模型在各业务场景端侧产品落地,覆盖“听、说、读、写、画”各应用场景。针对全模态大模型端侧化,vivo 从算法模型设计,到量化、性能瓶颈分析工具建设,再到底层运行时异构方案设计和业务框架层灵活的多业务部署架构建设,提供了完整的解决方案。通过软硬件协同,充分挖掘芯片潜力,确保大模型在端侧运行时的强悍性能。
AI落地三大挑战,训推一体架构协同
vivo AI工程架构专家陈崇沛分享vivo在大规模高性能计算领域的探索与创新。他指出,大规模训练、高性能推理及海量算力治理是AI落地面临的三大挑战。为此,vivo构建了大模型工程体系,解决了大规模训练的问题,让模型能按天迭代;解决高性能推理的问题,能秒级生成图片;搭建了坚如磐石的万卡集群,算力能持续稳定输出。这一体系全面支撑了vivo各模态、模型的训练与推理,广泛应用于vivo的AI产品中。
展望未来,vivo要打造出强有力的个人化智能产品,就要具备o1这类强逻辑推断能力的模型。而大模型工程的关键是性能和灵活性兼具的强化学习训练框架,这样才能发挥出强化学习Scaling law的威力。为了实现这个目标,vivo的思路是:以训推一体架构为基础,整合自研推理引擎和训练框架,满足多模型训练推理协同的要求,支持高性能、高灵活性的自博弈强化学习。