百度联合鹏城实验室发布全球最大中文单体模型鹏城-百度·文心 | 钛快讯

张帅_

张帅_

· 2021.12.08

该模型参数规模达到2600亿,在机器阅读理解、文本分类、语义相似度计算等60多项任务取得最好效果。

播放 暂停

百度联合鹏城实验室发布全球最大中文单体模型鹏城-百度·文心 | 钛快讯

00:00 03:51

钛媒体12月8日消息,鹏城实验室与百度联合召开发布会,正式发布双方共同研发的全球首个知识增强千亿大模型——鹏城-百度·文心(模型版本号:ERNIE 3.0 Titan)。同时,百度产业级知识增强大模型“文心”全景图首次亮相。

鹏城-百度·文心大模型发布

鹏城-百度·文心大模型发布

鹏城-百度·文心的关键词是“全球首个知识增强千亿大模型”,该模型参数规模达到2600亿,是目前全球最大中文单体模型,在机器阅读理解、文本分类、语义相似度计算等60多项任务取得最好效果,并在30余项小样本和零样本任务上刷新基准。

据了解,百度文心已大规模应用于百度搜索、信息流、智能音箱等互联网产品,同时通过百度智能云对外输出,例如在金融领域,基于百度文心实现了合同智能解析,能够在1分钟内完成对相关合同条款文本的解析识别,速度是之前的几十倍,大大提升了工作效率。百度智能云的智能客服也基于百度文心提升了服务的精准性,目前已经在中国联通、浦发银行等企业应用,拓展到全国各地。

在鹏城和百度的合作中,鹏城实验室主要提供算力系统“鹏城云脑Ⅱ”,百度主要依托于飞桨深度学习平台开展工作。“鹏城云脑Ⅱ”是国产自主的首个E级AI算力平台,曾在多个国际性能测试上获得冠军;飞桨是我国首个自主研发的深度学习开源开放平台,研制了端到端自适应分布式训练框架,实现多硬件支持,并行效率高达90%,有效支持鹏城-百度·文心千亿大模型高效、稳定地训练。

“文心”全景图

“文心”全景图

双方联手解决了超大模型训练的多个公认技术难题,使鹏城-百度·文心训练效率大幅提升,模型效果更优。

中国工程院院士、鹏城实验室主任高文表示,“预训练模型对整个科学的发展、社会的发展、创新的发展都是非常重要的工具。运用这个工具,可以帮助做很多人工智能的赋能,不局限于某个领域,这对人工智能的发展都是一个福音。”

百度首席技术官王海峰介绍,百度知识增强大模型从大规模知识和海量数据中融合学习,效率更高,效果更好,具有良好的可解释性。从2019年3月发布文心ERNIE 1.0,到最新的产业级知识增强大模型文心全景图,既包含基础通用的大模型,也包含面向重点领域、重点任务的大模型,以及丰富的工具与平台,有助于促进技术创新和产业发展。

此外,为解决大模型应用落地难题,百度团队首创大模型在线蒸馏技术,模型参数压缩率可达99.98%。压缩版模型仅保留0.02%参数规模就能与原有模型效果相当,有助于加速产业大规模的应用。

会上鹏城实验室与百度还成立了鹏城-百度自然语言处理联合实验室,在自然语言处理前沿研究和创新应用方面协同攻关。鹏城-百度·文心有望进一步解决 AI 技术在产业应用中缺乏领域和场景化数据等关键难题,该模型代码近期会在OpenI启智社区开源,依托鹏城云脑Ⅱ对外开放。百度文心也会通过百度飞桨平台陆续对外开源开放。

本文系作者张帅_授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本文观点仅代表作者本人,钛媒体平台仅对用户提供信息及决策参考,本文不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

”支持原创,赞赏一下“
钛粉30326 钛ae5u70 满级钛宝16422180875 马洋928 钛小超16395556011 钛粉25713
514人已赞赏 >
514换成打赏总人数514人赞赏钛媒体文章
关闭弹窗

挺钛度,加点码!

  • ¥ 5
  • ¥ 10
  • ¥ 20
  • ¥ 50
  • ¥ 100

支付方式

确认支付
关闭弹窗

支付

支付金额:¥6

关闭弹窗
sussess

赞赏金额:¥ 6

赞赏时间:2020.02.11 17:32

关闭弹窗 关闭弹窗

注册邮箱未验证

我们已向下方邮箱发送了验证邮件,请查收并按提示验证您的邮箱。

如果您没有收到邮件,请留意垃圾邮件箱。

更换邮箱

您当前使用的邮箱可能无法接收验证邮件,建议您更换邮箱

账号合并

经检测,你是“钛媒体”和“商业价值”的注册用户。现在,我们对两个产品因进行整合,需要您选择一个账号用来登录。无论您选择哪个账号,两个账号的原有信息都会合并在一起。对于给您造成的不便,我们深感歉意。