在2024 VDC,听一曲“蓝心智能”的江河协奏

2024-10-11

在2024 VDC,听一曲“蓝心智能”的江河协奏 (https://ic.work/) 技术资料 第1张

作为科技从业者,我们每年参加的终端产品发布会和开发者大会,少则几十场。说每一场都别有新意,那自然是不可能的,但每次去vivo的活动现场,总能给我耳目一新的感觉。

雨果说过,音乐可以表达难以用语言描述,却又不能对其保持沉默的东西。如果用音乐形容vivo近年来的一系列变化,可能是一首持续奔流的江河协奏曲。

还记得2019年第二届vivo开发者大会,大模型热潮尚未爆发,但vivo已经开始完整地讲述,AI和手机怎么结合,并定义了智慧手机,这可以看作其AI水脉的源起。

2023年vivo开发者大会上,当业界还在思考终端与大模型怎么结合,vivo首个推出了自研大模型矩阵——蓝心大模型,从千亿级云端大模型到十万级端侧模型,并开放给行业第三方,让AI的溪流泽被一方。

紧接着,涵盖芯片、续航、大模型、操作系统、影像等多项技术的“蓝科技”品牌亮相,让我们看到了vivo长赛道的技术布局,和支撑其AI战略的大江大河。

在2024 VDC,听一曲“蓝心智能”的江河协奏 (https://ic.work/) 技术资料 第2张

最近恰逢10月10日,vivo在深圳举办2024 vivo开发者大会,正式发布全新AI战略:蓝心智能,同时带来全面升级的自研蓝心大模型矩阵、OriginOS 5、蓝河操作系统2,以及在安全、人文、生态合作等方面的最新成果。

当AI的水脉支流,汇聚激荡在vivo,于是珠江水畔,响起了一支终端AI的江河协奏曲。

在2024 VDC,听一曲“蓝心智能”的江河协奏 (https://ic.work/) 技术资料 第3张

要了解vivo的AI水脉,需要回到创新最开始的地方。vivo所有的AI技术和应用,创新源头都来自用户。

vivo副总裁、OS产品副总裁周围曾公开提到,去年大模型爆火后,vivo做了五个月的市场研究,发现用户对AI技术能产生什么,不了解、没见过,所以AI怎么与手机的结合,很难再靠传统的用户访谈和市场研究来得到确切的方向和答案。

这就要求vivo的工程师和产品经理,必须站在用户的角度,变成代替用户去审视大模型的人,做原创性的创新。

以用户导向为驱动,vivo依靠这一本源的创新方法论,开始思考基于大模型的手机AI到底怎么做?最终得出结论,要将AI与用户数据、用户行为偏好相结合,努力给用户提供更懂你、更智能、更安全的个人化AI体验。

而建设个人化AI,是无法一蹴而就的,在产业实践中一般要经过三个层次:

第一步,改变传统业务。通过已有功能的AI化,让传统的产品功能变得更强大。

第二步,重构系统体验。基于AI大模型,搭建起系统的公共能力,重构整个系统的体验,比如智能编辑摘要能力,让文字、图片和第三方应用等来用。

第三步,建立行业基建。打造一些小的具有样板性的智能体,开放给整个行业,让行业都来用。

可以想象,沿着这三个层次走下来,终端AI不仅能获得大模型技术的水源灌溉,而且还拥有了系统内与行业的新基础设施,有了源源不断的创新动能。

把用户当做创新的起源地,vivo开始了自己的AI奔流。

在2024 VDC,听一曲“蓝心智能”的江河协奏 (https://ic.work/) 技术资料 第4张

水脉泽被一方,需要多条江河湖海的水资源,源源不断地汇聚灌溉。没有可持续、高强度的技术创新,AI很难在操作系统和行业土壤中刻下自己的河床。

此次vivo推出AI战略“蓝心智能”,希望将大模型技术与手机操作系统深度融合,为用户持续构建更自然、符合直觉的交互,带来更智能温暖的体验,自然也离不开多条技术“水系”,提供源源不断的创新支撑。

第一条技术水系,是蓝心大模型矩阵。

在2024 VDC,听一曲“蓝心智能”的江河协奏 (https://ic.work/) 技术资料 第5张

今年VDC大会,全新的蓝心大模型矩阵,变得更加壮阔。一方面,语音大模型进一步升级,重点优化意图理解与分发、任务规划能力,相比去年,整体能力提升30%。

另一方面,端侧大模型性能进一步提高。全新30亿参数的蓝心端侧大模型3B,在对话写作、摘要总结、信息抽取等能力上可以越级比肩行业7B-9B模型,能够“以小博大”更好地满足端侧AI的部署和使用需求。

此外,还发布了自研的蓝心语音大模型、蓝心图像大模型、蓝心多模态大模型,为手机赋予了“听”“说”“看”等能力,进一步丰富了蓝心大模型可处理的模态和专项任务。

第二条技术水系,是与行业伙伴合作的智能体生态。

vivo与各行各业的优秀伙伴合作,构建全新的智能体生态,打造了蓝心小V智能体广场,聚合不同领域的智能体,能在出行、健康、生活等方面为用户带来更多智慧服务。

比如【小V作业助手】可以协助家长用户为小学阶段的孩子提供免费的学习辅导,【小V运动教练】支持根据用户的运动目标,推荐和制定运动计划等。

这些智能体在OriginOS 5系统生态中流动着、奔涌着,为用户提供泛在、主动、精准的服务。

第三条技术水系,是蓝科技的多条技术线。

存储、通信、续航等技术的协同,可以为AI与手机的结合提供助力。比如在性能方面,OriginOS 5通过在存储、计算效率及显示体验等方面的整体优化,实现“重载如轻载,长久使用亦流畅”,更能轻松应对大型手游等重载场景,也让AI专项任务更加丝滑、流畅。本次升级的蓝海续航系统,通过引入场景能效引擎、重构多媒体视频架构等方式,实现了电量高效精准管理,全天候续航无忧,应对AI应用的功耗挑战。

在2024 VDC,听一曲“蓝心智能”的江河协奏 (https://ic.work/) 技术资料 第6张

此次大会上,vivo还发布了基于Rust语言编写的实时操作系统内核——蓝河内核,加上“天生更智慧、天生更流畅、天生更安全”的特性,将AI大模型融入系统的底层设计中,让用户和开发者加速进入智慧时代。

在2024 VDC,听一曲“蓝心智能”的江河协奏 (https://ic.work/) 技术资料 第7张

这些技术“水系”的持续奔流,不断向前,推动着vivo利用AI重构系统体验。

在2024 VDC,听一曲“蓝心智能”的江河协奏 (https://ic.work/) 技术资料 第8张

从大禹治水到京杭运河,中国人自古以来都十分重视水利工程,将水力转化为生产力。同样的,AI要造福用户,也要有适配的基础设施,既能让AI能力被便捷地获取,又要满足隐私保护、提质增效等现实要求。

vivo将大模型技术与手机操作系统深度融合,把OriginOS打造成为AI手机的基础设施,进行了三个方面的重构:

1.重构人机交互体验。

智能助手,是手机应用服务与用户之间的最短入口,也是最需要被AI改造的交互方式。OriginOS 5将“Jovi语音”与“蓝心小V”进行了深度的融合,升级后的蓝心小V,智慧能力也全面升级。

从时效上看,沟通更便捷、更主动、更及时。【小V建议】常驻桌面,可以24小时提供主动贴心服务。比如经常出差的职场人,出发当天,从出门的打车建议,到达机场后的登机口提醒,抵达目的地的城市攻略,入住酒店的提醒等,小V都能提前预知并给出最合时宜的建议。同时,小V还支持跨端陪伴,在不方便拿手机的赶路途中,通过手表、汽车、电脑都可以感受到每时每刻的陪伴。

在2024 VDC,听一曲“蓝心智能”的江河协奏 (https://ic.work/) 技术资料 第9张

从质量上看,服务更默契、更懂你、更温暖。基于蓝心大模型的理解能力和小V强大的意图识别能力,OriginOS 5带来了众多高质量的交互服务,比如【原子岛】能够结合用户的日常用机习惯,带来更加精准的服务建议;【小V记忆】默默记忆着人机互动的点点滴滴,认真整理用户日常收藏的各种各类文章、视频,让人机交互更有默契。

在2024 VDC,听一曲“蓝心智能”的江河协奏 (https://ic.work/) 技术资料 第10张

2.重构数字生活体验。

传统的移动应用服务,需要用户被动获取,无法提供个性化服务,而基于大模型的智能体,结合vivo的个人智能系统框架,让手机成为专属个人助理。

比如vivo推出的手机智能体PhoneGPT是其对未来的又一次技术探索,它可以基于用户意图拆解需求,主动规划路径,并实时环境识别和动态反馈决策的多模态助理。

举个例子,帮用户订餐厅,涉及一个很长的任务链条,包括语音对话、理解需求、筛选餐厅、智能预约……即使是这个超长的任务链路,PhoneGPT也可以轻松驾驭。【小V订餐助手】会准确地完成意图理解,根据需求找到合适的餐厅并完成预约。

可以说,智能体赋予了手机主动服务、个性化服务的能力,改变了我们以往使用数字服务的方式,重构人与数字世界的服务体验。

3.重构数实互动体验。

除了数字世界的功能与服务,人还需要与物理世界进行互动,传统智能手机不具备理解物理世界的视觉、听觉能力,导致一些实际生活中的痛点问题难以解决,比如视障人士出门连接社会、听障人士与外界交流等,手机很难帮助他们。

但有了多模态大模型之后,vivo让手机变成了“眼睛”,“vivo看见蓝心升级版” 能够理解镜头画面中的一花一草、交通建筑等各种物体,帮助视障人士独自安全地探索世界;“vivo听见”也可以基于蓝心语音大模型,让用户与他人的交流更加自然、方便。

在2024 VDC,听一曲“蓝心智能”的江河协奏 (https://ic.work/) 技术资料 第11张

vivo蓝心智能将大模型技术与手机操作系统深度融合,不仅全方位重构了OriginOS的体验,也让“AI手机”得以真正造福于用户。

正如周围所说的,“手机它不是一个很神秘的东西,就是平常我们用来生活、工作的,我们不去做很伟大、很复杂的东西,就想把它的体验做好、功能增强”。

用户导向驱动的“AI手机”,并不一定需要炸裂、颠覆的噱头,它更可能是像水一样,善利万物而不争,融于日常而无形。

在2024 VDC,听一曲“蓝心智能”的江河协奏 (https://ic.work/) 技术资料 第12张

以OriginOS作为AI手机的基础设施,vivo完成了“系统能力的搭建”,蓝心智能的下一步,则是成为行业AI的基础设施。

没有海洋,河流终会枯竭,没有整个行业的蓬勃发展、共襄AI盛举,单个企业的AI投入与创新将是无底洞。vivo一直坚持开放的AI战略,让自研技术创新流入行业的海。

一方面,vivo不碰行业第三方的业务,得以与软件应用伙伴紧密合作,共同构建智能体生态,助力互联网服务的智能化升级。

另外,陆续对行业开放全模态大模型端侧化相关能力,包括成熟的算法能力,和端侧高效部署的加速能力,让行业各类开发者都能在自己的场景中应用大模型。

此外,vivo蓝心智能的许多先行探索,都为终端行业的AI发展写下了参考答案。比如首发的覆盖云、边侧的蓝心大模型矩阵,以及针对大模型安全的问题,制定了一个全面的管控体系,管控范围包含10个大类,66个二级维度,195个三级类别……这些都让行业减少了试错成本。

所以,总结一下vivo的AI战略,从用户导向的源头而来、向产业生态奔流的蓝心智能,就像人类为了自身福祉而兴修水利,将水力转化为生产力,也是从用户的福祉和实际需求出发,不局限于引入AI技术,更放眼于系统级、行业级基础设施的修建,为AI手机夯实了可持续发展的基础。

大江来从万山中,欲破巨浪乘长风。从2019的智慧手机,到如今用AI完整重构系统,vivo用滔滔不绝、泽披四方的AI奔流,让世人看到了国产终端厂商从未停止的创新步伐,奏响一曲AI时代的江河协奏。

在2024 VDC,听一曲“蓝心智能”的江河协奏 (https://ic.work/) 技术资料 第13张


审核编辑 黄宇

文章推荐

相关推荐