“悟道3.0”大模型系列成果亮相北京智源大会

6月9日-10日,“北京智源大会”在中关村国家自主创新示范区会议中心举行。智源研究院院长黄铁军发布《2023智源研究院进展报告》,并发布了全面开源的“悟道3.0”系列大模型及算法。

200余位人工智能顶尖专家云集北京智源大会,探讨通用人工智能发展面临的机遇与挑战。主办方供图

智源“悟道3.0”进入全面开源新阶段


(资料图片仅供参考)

2021年3月,在悟道1.0发布会上,智源研究院研判人工智能已经从“大炼模型”转变为“炼大模型”的新阶段,从此,“大模型”这个概念进入公众视野。2021年6月1日,“悟道2.0”模型发布,其参数规模达到1.75万亿,是当时中国首个、全球最大的万亿级模型。

何为大模型?黄铁军认为需要具备三个条件:一是规模要大,参数达百亿规模以上;二是涌现性,能够产生预料之外的新能力;三是通用性,不限于专门问题或领域,能够处理多种不同的任务。

如今,该系列模型已发展到“悟道3.0”版本,涵盖语言、视觉、多模态等基础大模型,现在已全面开源,带来一系列领先成果,包括“悟道·天鹰”(Aquila)语言大模型系列、天秤(FlagEval)开源大模型评测体系与开放平台、“悟道 · 视界”视觉大模型系列,以及一系列多模态模型成果。

“天秤”协助研究人员评估基础模型及训练算法性能

为推动大模型产业落地和技术创新,智源研究院发布“开源商用许可语言大模型系列+开放评测平台” 两大成果,打造“大模型进化流水线”,持续迭代、持续开源开放。

其中,“悟道·天鹰”(Aquila)语言大模型是首个具备中英双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型。其在中英文高质量语料基础上从0开始训练,通过数据质量的控制、多种训练的优化方法,实现在更小的数据集、更短的训练时间内,获得比其他开源模型更优的性能。

天秤(FlagEval)开源大模型评测体系与开放平台,旨在建立科学、公正、开放的评测基准、方法、工具集,协助研究人员全方位评估基础模型及训练算法的性能,同时探索利用AI方法实现对主观评测的辅助,大幅提升评测的效率和客观性。

目前已推出语言大模型评测、多国语言文图大模型评测及文图生成评测等工具,并对各种语言基础模型、跨模态基础模型实现评测。后续将全面覆盖基础模型、预训练算法、微调算法等三大评测对象,包括自然语言处理(NLP)、计算机视觉(CV)、音频(Audio)及多模态(Multimodal)等四大评测场景。

“天演”接入天河新一代超级计算机,提升神经元网络仿真性能

智源研究院还在AI for Science领域进行探索,通过人工智能与基础科学深度融合的崭新科研范式,延展不同科学领域的探索边界。在相关研究中,智源团队在生命演化和蛋白质结构预测方向作出了成果。

据悉,OpenComplex是智源健康计算研究中心打造的面向生物大分子的开源人工智能算法平台,目前已开源蛋白质、RNA以及复合物的高精度结构预测训练和评测代码。

去年智源大会发布了最高精度的仿真线虫。现在,智源开放仿真线虫研究所使用的“天演”平台,提供在线服务。天演是超大规模精细神经元网络仿真平台,基于该平台,可实现对生物智能进行高精度仿真,探索智能的本质,推动由生物启发的通用人工智能。

为提升神经系统仿真规模与性能,天演团队将天演接入我国新一代百亿亿次超级计算机——天河新一代超级计算机。通过“天演-天河”的成功运行,实现鼠脑V1视皮层精细网络等模型仿真,计算能耗均可降低约10倍以上,计算速度实现10倍以上提升,达到全球范围内最极致的精细神经元网络仿真性能。

新京报记者 张璐

编辑 刘梦婕 校对 吴兴发

推荐内容