英特尔至强处理器优化AI方案,大幅降低成本,助力Aible发展AI技术。

2024-07-04

概要:英特尔与Aible合作,推出基于至强处理器的无服务器AI解决方案,降低成本、提高智能化,并优化RAG及微调效率。通过工程优化和基准测试,显著增强Aible为企业提供生成式AI结果的能力,并支持NLP、推荐系统等应用。双方合作显示英特尔致力于推动AI创新,降低客户使用至强处理器运行AI工作负载的门槛。



对于追求尖端AI技术的企业来说,搭载英特尔至强处理器的Aible无服务器解决方案犹如一道曙光,它以其卓越的效能与智能,为企业带来了成本的降低和RAG及微调效率的飞跃。


近日,英特尔携手Aible,这家端到端Serverless(无服务器)生成式AI和增强型分析方案的领航者,共同推出了面向企业客户的革新性解决方案。此方案充分利用了英特尔



®



至强



®



系列CPU的卓越性能,为生成式AI与检索增强生成(RAG)用例注入了强大的动力。通过工程优化和基准测试项目的深入合作,Aible得以以更低的成本为企业客户提供生成式AI的卓越结果,并助力开发人员轻松部署AI应用。这一高效、可扩展的AI解决方案,正是借助高性能硬件,为企业客户应对AI挑战提供了坚实的后盾。

英特尔至强处理器优化AI方案,大幅降低成本,助力Aible发展AI技术。 (https://ic.work/) 产业洞察 第1张


提及英特尔至强处理器,它早已成为业界公认的卓越之选。


英特尔数据中心与人工智能事业部高级首席工程师Mishali Naik表示:“在AI领域,企业正寻求更高效、更智能的解决方案。我们与Aible的合作,正是英特尔与行业共谋发展,推动AI创新,降低客户使用英特尔至强处理器运行最新生成式AI工作负载门槛的生动体现。”



至强处理器的生成式AI性能:



Aible的解决方案以实力证明了CPU在提升从运行语言模型到RAG等一系列最新AI工作负载性能上的巨大潜力。基于针对英特尔处理器的精心优化,Aible技术采用了高效、智能的“端到端无服务器”方法,实现了资源消耗的极致控制。例如,在用户查询触发下,向量数据库仅需数秒即可迅速激活并检索相关信息,而语言模型也仅需短暂启动即可迅速处理并回应用户请求。这种按需操作的运行模式,为企业节省了大量成本,实现了总拥有成本(TCO)的大幅降低。


尽管RAG功能在传统上依赖于GPU和加速器的并行处理能力,但Aible的无服务器技术与英特尔至强处理器的完美结合,使得RAG用例完全可以通过CPU来驱动。性能数据清晰表明,多款不同代际的英特尔至强处理器均能够高效运行RAG工作负载,为企业带来了前所未有的性能体验。

英特尔至强处理器优化AI方案,大幅降低成本,助力Aible发展AI技术。 (https://ic.work/) 产业洞察 第2张


如图配置详细信息所示,请注意,实际结果可能因环境差异而有所不同。



重要意义:



Aible通过无服务器方式利用CPU资源,实现了在多个客户之间安全共享底层计算资源的目标,从而为企业客户显著降低了生成式AI项目的运营成本。这种成本降低的方式,可类比于用户仅在需要时购买电力,而非直接租赁发电机。随着生成式AI需求的迅猛增长,性能优化和节能降耗变得愈发重要。Aible所提供的基于CPU的服务,无疑为企业客户提供了一种既经济又高效的解决方案。


据Aible的基准测试分析,当企业采用基于CPU的无服务器解决方案运行RAG模型时,成本节省可高达惊人的55倍。这一显著的成本降低不仅证明了Aible独家方法的有效性,同时也凸显了无服务器CPU采用方式在降低通过共享服务或专用服务器构建

文章推荐

相关推荐