思必驰专注构建自主知识产权,打造领先智能基座模型,引领未来科技。

2024-07-05

概要:2024世界人工智能大会期间,长三角协同创新论坛聚焦AI新质生产力。思必驰首席科学家俞凯分享跨模态语言大模型ChemDFM,展现大模型在科学领域的应用潜力。思必驰积极推动长三角一体化发展,通过创新联合体等形式,为区域发展注入动力。

在盛夏的七月,上海迎来了举世瞩目的2024世界人工智能大会暨人工智能全球治理高级别会议(简称“WAIC 2024”)。而在这一盛会中,一场闪耀着智慧光芒的论坛——“2024 WAIC 长三角协同创新AI新质生产力发展论坛”也同步举办。论坛由长三角国家技术创新中心精心策划,汇聚了全球顶尖的产学研用领域专家、学者和企业代表,共同探寻人工智能在新质生产力发展中的巨大潜力和未来趋势。

论坛现场,思必驰的联合创始人、首席科学家俞凯先生,以其深厚的学术造诣和前瞻性的见解,为与会者带来了一场题为《AI4S 新质生产力,面向通用科学智能的跨模态语言大模型》的演讲。他详细解读了面向通用科学智能的跨模态语言大模型ChemDFM,深入剖析了大模型在科学领域的应用前景,并探讨了其推动科学研究的新路径。


随着大模型技术的迅猛发展,它已逐渐渗透到各个行业,为行业带来了前所未有的效率提升。在科学领域,大模型更是展现出强大的赋能能力,为科学研究注入了新的活力。

在演讲中,俞凯先生详细阐述了化学领域大模型的优势。他强调,相较于通用大模型,化学领域大模型拥有更为丰富的化学知识,能够理解和处理更为多样化的化学信息,从而具备更强大的解决化学问题的能力。同时,相较于传统小模型,它还能以自然语言为桥梁,实现知识与对话的无缝衔接,具备错误反思、方案细化等高级功能。

随后,俞凯先生分享了思必驰在化学领域大模型研究的最新成果。他介绍道,2024年3月12日,思必驰与上海交大智能人机交互联合实验室、苏州实验室共同发布了首个针对化学科学的百亿级专业化大模型ChemDFM。该模型基于经典开源大模型LLaMa,融入了海量的化学基础与前沿知识,深入学习了化学科学的专有语言和表达方式。经过严格测试,ChemDFM在大多数化学相关能力上均超越了公认最强大的模型GPT-4。更令人振奋的是,ChemDFM还具备其他类似模型几乎不具备的结合内部知识理解和分析陌生分子的能力,为科学研究开辟了新的可能。

近期,浙江大学 NLP 实验室与腾讯 AI Lab 的研究者构建了 SciKnowEval 评测基准,该基准定义了从L1到L5不同层级的科学智能,共包含化学和生物领域50,000个不同层次的科学评测题目。通过对20个开源和闭源LLMs的基准测试,结果显示,ChemDFM-13B在专业领域知识测试中表现优秀,不仅全面领先其他开源模型,其化学水平也整体逼近GPT-4o、Gemini1.5-Pro等千亿甚至万亿参数的通用大模型,充分展现了垂域科学大模型的优势。在化学领域最高级的L5级任务中,ChemDFM-13B更是全面超越了通用大模型。

展望未来,俞凯先生表达了对大模型技术的坚定信心。他认为,我们要积极构建具有自主知识产权的科学智能语言大模型,为我国的科研事业提供坚实的支撑。同时,他还强调,要充分利用科研第五范式推进科学发现,不断推动科学技术的发展和创新。

长三角地区作为中国经济最发达、科技创新最活跃的地区之一,为大模型技术的发展提供了得天独厚的条件。思必驰作为长三角地区科技创新的佼佼者,正积极发挥自身优势,推动长三角一体化发展。近年来,思必驰不断发挥自身潜力,积极促进产业链上下游的交流与合作。通过参与“苏州市创新联合体”、“江苏省人工智能语言计算创新联合体”和“长三角语言计算创新联合体”等多个创新联合体项目,思必驰不仅加强了与产业链上下游企业的紧密联系,还推动了产业重大前沿技术的协同攻关。

展望未来,思必驰将继续深耕长三角地区,加强与产业链上下游企业的合作与交流。通过不断推动区域赋能和开展产业重大前沿技术协同攻关,思必驰将为长三角一体化发展注入源源不断的动力。

文章推荐

相关推荐