谷歌开源70亿参数大语言模型，全方位超越Meta Llama-2？

2024-02-23

在Sora把AI生成领域的视线全部吸引过去的这段时间里，谷歌却依然在竭尽全力推进新的生成模型发展。除了上周发布的下一代Gemini 1.5外，谷歌也在近日推出了一系列基于Gemini打造的开源模型Gemma。

谷歌加入AI模型开源阵营，Gemma横空出世

根据谷歌的介绍，Gemma是由谷歌DeepMind以及其他团队开发，由Gemini启发并采用了相同的研究与技术的轻量级模型。与之一起发布的还有全新的响应式生成AI工具包，为利用Gemma创造更安全的AI应用提供关键工具和指导。

从参数大小上来看，Gemma分为20亿参数和70亿参数两个版本，且每个版本又有基础版和指令调整版两个变体。其中70亿参数的版本适合消费级的GPU和TPU开发，而20亿参数的版本可以用于CPU和端侧应用上。

在预训练数据上，Gemma 2B和7B分别采用了2T和6T的Token进行训练，数据来源是以英文为主的网络文档、数学计算和代码。需要注意的是，尽管其背后所采用的技术与Gemini类似，但这些模型并不属于多模态模型，也并不适合用于追求极致的多语言任务性能。

在训练硬件上，谷歌采用了自研的TPUv5e，其中Gemma 7B用到了4096块TPUv5e进行训练，Gemma 2B用到了512块TPUv5e进行训练。

开源LLM混战，Gemma 7B超越Llama-2 13B？

根据谷歌官方提供的数据，与Meta的Llama-2相比，Gemma 7B在多个项目上展现出了优势，比如大规模多任务语言理解、GSM8K和Math计算和HumanEval Python代码生成等应用上，都超过了Llama-2 7B，甚至不少超过了Llama-2 13B。
谷歌开源70亿参数大语言模型，全方位超越Meta Llama-2？ (https://ic.work/) AI 人工智能第1张
开源模型文本任务性能对比 / 谷歌,
谷歌表示，与同等体量的开源模型对比，比如LLaMA-2和Mistral等，18项文字相关的任务中，Gemma能够做到在11项任务中性能胜出，且平均性能得分占优。

不过Gemma也并不是完全超越了Llama-2，从Huggingface给出的平均得分来看，Gemma 7B超过了同级别的Llama 2 7B，但还是低于LLama 2 70B Chat，不过考虑到这两者之间的参数差异，也印证了Gemma 7B的强大。至于Gemma 2B，与同规格的其他优秀开源LLM相比，比如PHI-2，也不存在优势。

作为一个轻量级的模型，Gemma也对跨设备兼容性做了优化，可以在笔记本、PC、IoT设备、智能手机和云端运行。谷歌也与英伟达达成合作，Gemma针对英伟达的GPU硬件进行了优化，无论是云端的AI GPU还是桌面端的RTX AI PC，都能享受Gemma带来的性能。

写在最后

尽管Gemma是谷歌首个大型的开源LLM，但这早已经不是谷歌对开源AI社区做出的首个贡献了，诸如Transformers, TensorFlow, BERT, T5, JAX, AlphaFold和AlphaCode等，可以说当前AI能够有如此繁荣的开发生态，谷歌做出了不少贡献。无疑Gemma的出现，也会给AI开发生态带来新的选择。

文章推荐

谷歌开源70亿参数大语言模型，全方位超越Meta Llama-2？

相关推荐

伟测集成电路芯片测试基地竣工，晶圆级与成品测试项目全面启动。

俄罗斯光刻机突破，350nm技术成功实现，引领科技新篇章。

中国团队突破，全可编程拓扑光子芯片研制成功，引领科技新潮流。

上海新政力推人工智能、算力芯片，科技新风向，不容错过！

美国拟限AI大模型出口，全球科技格局生变，速览最新动态！

博世2024传感器新品：SCS智能互联与两大创新系列，引领行业变革。

OpenAI发布AI图片检测工具，准确率98%，并研发AI音频水印，引领新潮流。

AI医院小镇登陆清华，AI医生超人类，数天诊治万人，快来体验未来医疗！

谷歌AlphaFold 3预测生命分子，登Nature，免费开放，加速科研亿年！

OpenAI掌门人谈AI：末日说夸张，对技术革命持乐观审慎态度。

推荐

VCSEL芯片和光学解决方案提供商瑞识科技完成近亿元B1轮融资

一文带你搞懂开关电源电路

基于脱硝系统改造的自动化优化分析

阿诗特能源L1000液冷新品震撼上市，卓越性能，引领未来！

博世与芯驰科技全面深化战略合作围绕车用半导体核心技术

PLL锁相环：工作原理简述，高效同步控制的核心技术。

中科曙光助力北京航天总医院打造24小时在线的AI医疗助手

国产替代奋进高端，创新引领，开启替代新篇章。

模拟芯片与数字芯片各有独特优势，各具魅力，吸引你的目光。

本征半导体，基础材料之选，了解它，掌握电子世界的关键！

最近更新

H20禁令反转！国产AI芯片强势崛起，谁将成为破局王炸？

营收创新高！净利润飙涨5倍，韦尔手机和车用CIS新品成增长引擎

华为新一代智能眼镜现身，加速“量产厮杀”阶段到来

喜报！ | 同星智能入选首届福布斯中国投资价值初创企业100系列名单

携手共进，探索电子行业新机遇 | 华昕电子与深圳市企业高质量发展促进会深度交流

国产传感器新品迭出，自供电振动传感器弯道超车

江西萨瑞微电子参加2025慕尼黑上海电子展圆满闭幕

聚势赋能同心共赢 | “新智中国行2025”数科伙伴研讨沙龙在拓维信息总部举行

德施曼2025新品发布会倒计时，以AI之名，再启技术革命

好消息！启明智显5G CPE全面支持全国产鼎桥MT5700和MT5710！

谷歌开源70亿参数大语言模型，全方位超越Meta Llama-2？

相关推荐

推荐

VCSEL芯片和光学解决方案提供商瑞识科技完成近亿元B1轮融资

一文带你搞懂开关电源电路

基于脱硝系统改造的自动化优化分析

阿诗特能源L1000液冷新品震撼上市，卓越性能，引领未来！

博世与芯驰科技全面深化战略合作 围绕车用半导体核心技术

PLL锁相环：工作原理简述，高效同步控制的核心技术。

中科曙光助力北京航天总医院打造24小时在线的AI医疗助手

国产替代奋进高端，创新引领，开启替代新篇章。

模拟芯片与数字芯片各有独特优势，各具魅力，吸引你的目光。

本征半导体，基础材料之选，了解它，掌握电子世界的关键！

最近更新

H20禁令反转！国产AI芯片强势崛起，谁将成为破局王炸？

营收创新高！净利润飙涨5倍，韦尔手机和车用CIS新品成增长引擎

华为新一代智能眼镜现身，加速“量产厮杀”阶段到来

喜报！ | 同星智能入选首届福布斯中国投资价值初创企业100系列名单

携手共进，探索电子行业新机遇 | 华昕电子与深圳市企业高质量发展促进会深度交流

国产传感器新品迭出，自供电振动传感器弯道超车

江西萨瑞微电子参加2025慕尼黑上海电子展圆满闭幕

聚势赋能 同心共赢 | “新智中国行2025”数科伙伴研讨沙龙在拓维信息总部举行

德施曼2025新品发布会倒计时，以AI之名，再启技术革命

好消息！启明智显5G CPE全面支持全国产鼎桥MT5700和MT5710！

博世与芯驰科技全面深化战略合作围绕车用半导体核心技术

聚势赋能同心共赢 | “新智中国行2025”数科伙伴研讨沙龙在拓维信息总部举行