2024CTIS-文章详情页顶部

王小川发布开源大模型Baichuan2,称中英文全面超越美国Llama 2|钛媒体焦点

预计百川智能将在今年第四季度发布千亿参数模型,明年一季度左右推出 “超级应用”。

搜狗创始人、百川智能创始人兼CEO 王小川(来源:受访者提供)

搜狗创始人、百川智能创始人兼CEO 王小川(来源:受访者提供)

随着8月底百川大模型对外开放,王小川团队加速研发新产品。

钛媒体App获悉,9月6日下午,人工智能(AI)大模型公司 百川智能在北京发布最新70亿、130亿参数的两款Baichuan2系列开源大模型Baichuan2-7B、Baichuan2-13B,文科理科能力全面提升,支持中、英等数十种语言,应用于学术研究、互联网、金融等领域。

相比一代,Baichuan2数学能力提升49%,代码能力提升46%,安全能力提升37%,逻辑能力提升25%,语义理解能力提升15%,均处于开源模型最好水平。

百川智能创始人兼CEO 王小川表示,70亿参数的Baichuan2-7B在中英文主流任务全面超越Meta研发的开源大模型Llama2-13B。随着国内Baichuan2开源大模型的发布,再用Llama 2作为大家一个开源模型的时代已经过去了。

“我们现在可以获得一个比Llama2更加友好、能力更强的这样一个开源模型,能够去帮助我们扶持中国整个大模型生态发展。那么除了开源模型之外,下次我们再闭源里面可能会有一个新的突破,希望能够在大模型领域为中国社会经济发展带来我们的贡献。”王小川表示。

清华大学计算机系教授、中国科学院院士张钹表示,尽管中国已经发布了众多参数规模从几十亿到几百亿的大型模型和相应的企业,但这些模型大多应用于工业领域,学术研究的应用却相对较少,尤其大模型幻觉问题严重。百川开源大模型在学术研究上的应用显得尤为重要和紧迫,这有助于我们更深入地解释和理解大模型技术。

“我们必须深入探讨和明确这些(可解释、幻觉)问题,只有这样,我们才能更好地发展中国的大模型产品。”张钹称。

据悉,百川智能创立于今年4月10日,由搜狗创始人王小川、前搜狗COO茹立云联合成立,旨在打造中国版的OpenAI,构建中国最好的大模型底座,并在教育、医疗等领域应用落地。截至目前,百川智能已公布首轮5000万美元融资。

过去149天,百川智能平均每28天发布一款大模型,已连续推出70亿、130亿参数的两款开源大模型Baichuan-7B、Baichuan-13B,以及今年8月公布的530亿参数、面向B端用户的闭源通用大模型Baichuan-53B,在写作、文本创作等领域能力已达到行业较好水平。

王小川此前对钛媒体App表示,开源大模型里面,百川智能在中文领域现在就可以替代,在某些应用中已经超越闭源的GPT模型,未来其开源模型能力一定会超越Meta Llama 2。他强调,未来可能80%的场景会用到开源模型。而百川智能目前已完成了“开源+闭源”大模型并行布局,希望做到中国最好的、对标GPT的模型。

据悉,截至目前,百川开源大模型已经在开源社区总下载量超越500万。其中,Hugging Face首周下载量达百万,近一个月的下载量337万。而且在Github上,baichuan系列模型是星标月涨幅最快的中国大模型。

企业端,截至目前,已经又超过200家企业已申请百川大模型开源和商业授权,并已将百川模型投入实际生产场景。企业涵盖互联网、软件和信息技术、金融、法律、教育、制造业、企业服务等众多领域,客户包括阿里云、腾讯、火山引擎、京东科技、顺丰科技、浪潮、中国农业银行、蔚来汽车等。

今年8月31日,百川智能旗下产品“百川大模型”等10余款大模型产品完成备案,成为中国首批面向公众提供类似ChatGPT服务的 AI 大模型产品。

此次,百川智能公布的最新开源大模型Baichuan2系列,文科理科全面提升,拥有2.6TB训练的超大规模语料,数据方面规模大、覆盖全、质量优,篇章、段落、句子质量打分,支持细颗粒采样,训练则是高效、稳定、可预测,安全方面实施了安全价值观对齐,实现了多阶段多目标的强化学习。同时,百川Baichuan2系列开源大模型提供更透明、更开放,公布了3000亿-2.6万亿tokens的模型训练中间过程,助力大模型研究。

另外,王小川还宣布,中国计算机学会(CCF)和百川联合成立大模型研究基金,旨在推动围绕大模型不同阶段、不同维度等相关技术研究,支持医疗、开放世界Agent。而且,百川智能还将与亚马逊云科技成立AI黑客松活动,在医疗健康、游戏娱乐两大赛道支持AI大模型研究,冠军奖励超过20万元。

合作伙伴方面,百川智能与阿里云、高通、英博数科、瀚博半导体、火山引擎、寒武纪、华为等公司合作落地百川大模型。

王小川早前向钛媒体App透露,百川智能将在今年第四季度发布千亿参数模型,预计明年一季度前后推出 “超级应用”。

(本文首发钛媒体App,作者|林志佳)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 底座模型不会用人家的来微调的吧,要论知识产权,论实干,国内这群互联网公司真是每一个能打

    回复 2023.09.06 · via netease
  • 意思就是,百川

    回复 2023.09.06 · via netease
  • 已经在本地试过了,很不错

    回复 2023.09.06 · via netease
  • 基于那个开源项目改没说

    回复 2023.09.06 · via netease

快报

更多

2024-06-06 23:01

海南自贸港新规7月1日起生效,探索开展临时仲裁

2024-06-06 22:53

蔚来透露第三品牌Firefly进展,争取明年上半年开始交付

2024-06-06 22:52

江苏淮安:房票全市通用,使用房票购买商品房奖励房票使用金额的10%

2024-06-06 22:52

宁波象山:首次申请公积金贷款购买首套自住住房的,最高贷款额度提高至100万元/户

2024-06-06 22:48

欧洲央行官员几乎排除了7月降息的可能性,9月尚不清楚

2024-06-06 22:35

蔚来:蔚来能源有独立融资计划,后续会继续开放投资

2024-06-06 22:30

美国至5月31日当周EIA天然气库存增加980亿立方英尺

2024-06-06 22:28

5月挖掘机国内销量8518台,同比增长29.2%

2024-06-06 22:26

SpaceX超级火箭“星舰”历史上第一次完成试飞任务

2024-06-06 22:24

广电总局约谈九州文化,要求整改违规微短剧

2024-06-06 22:16

马斯克:SpaceX星舰尽管失去了许多外材料和受损的襟翼,星舰还是在海洋中实现了软着陆

2024-06-06 22:14

前兰博基尼超跑设计负责人正式入职小鹏汽车

2024-06-06 22:13

今年全国农业灌溉面积已超4亿亩

2024-06-06 22:13

恒大汽车:将于6月28日举行股东周年大会

2024-06-06 22:09

广电总局:大力推进超高清电视全产业链优化升级,全面深化人工智能大模型行业应用

2024-06-06 22:09

世界杯预选赛中国1:1战平泰国,保留出线希望

2024-06-06 22:07

全国牛肉价格受多重因素影响连续下降,同比降幅达18.5%

2024-06-06 22:05

长安汽车与广汽集团在重庆签署战略合作框架协议

2024-06-06 22:04

美国5月全球供应链压力指数-0.48,前值-0.85

2024-06-06 22:04

王毅同古巴国家主席特使、外交部长罗德里格斯会谈

4

扫描下载App