全文1118字,约2分钟

00:00 / 03:23

小米AI大模型MiLM-6B首次曝光:64亿参数量,此前称不单独做ChatGPT|钛快讯

这是小米大模型产品的首次曝光,也是小米史上首个GPT大模型产品亮相。

小米总部园区

小米总部园区

在小米公司CEO雷军演讲前夕,其研发的人工智能(AI)大模型产品悄然现身。

钛媒体App获悉,8月11日,小米公司开发的大规模预训练语言模型 MiLM-6B/1.3B登陆代码托管平台GitHub,参数规模最高达64亿,而且现身在C-Eval、CMMLU基准评测榜单。

截至当前,小米大模型MiLM-6B在C-Eval总榜单排名第10、同参数量级排名第1,平均分为60.2分超过了阿里云Qwen-7B、OpenAI研发的ChatGPT(今年5月数据)等,而MiLM-1.3B排行第30名,平均分45.8分,接近谷歌投资的Anthropic公司的Claude 1.0版本大模型。

这是小米大模型产品的首次曝光,也是小米史上首个GPT大模型产品亮相。

事实上,随着ChatGPT风靡全球,今年4月14日,小米公司宣布成立小米 AI 实验室大模型团队,由栾剑带队向王斌汇报。据悉,AI实验室是小米AI战略的核心部门,而大模型负责人王斌曾在中科院从事了20多年NLP(自然语言处理)相关的研究和开发工作,2018年加入小米,2019年起负责AI实验室。

小米CEO雷军当时表示,公司正在研发一些技术和产品,等打磨好了再给大家演示。小米集团总裁卢伟冰称,小米目前拥有超过1200人的AI团队,会积极拥抱大模型,与业务深度结合,但不会像OpenAI一样。

今年6月,王斌对外透露,小米会去自研通用语言大模型,但不会单独发布一款类ChatGPT产品。他表示,小米第一步的目标基座模型参数在几百亿,而且小米大模型将会落地小爱同学、loT、自动驾驶、机器人等现有场景中,并利用丰富的应用场景反哺大模型能力。

成立仅仅四个月后的今天,小米公布了大模型产品——MiLM-6B,并在C-Eval和CMMLU基准评测上均取得同尺寸较好效果。

其中,在C-Eval评估中,MiLM-6B的平均得分为60.2,在不同学科和难度级别(如STEM、社会科学、人文学科等)得分从42分到71.7分不等。在CMMLU评估中,MiLM-6B在零样本和五样本测试中的平均得分分别为60.37分和57.17分,表现出良好的知识和推理能力。

据悉,C-Eval榜单是清华大学、上海交通大学和爱丁堡大学共同构建的综合汉语模型评估套件,而CMMLU则是综合汉语模型基准。

预计小米将会于8月14日举行2023雷军年度演讲,但目前雷军暂未透露是否会发布MiLM-6B大模型技术。

钛媒体App向团队询问关于MiLM-6B/1.3B是否开源、产品是否已经落地内测等问题,截至发稿前暂未得到小米官方回复。(本文首发钛媒体App,作者|林志佳)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 有当年网盘大战那味儿了

    回复 8月17日 · via android
  • 通用大模型的研发现在看来并不光明

    回复 8月13日 · via android
  • 还是个噱头吧

    回复 8月12日 · via android
  • 目测应该还不如文心一言

    回复 8月12日 · via pc
  • 小米现在也不平价了

    回复 8月12日 · via pc
  • 小米也搞大模型

    回复 8月12日 · via h5
  • 小米务实,先干出来再说。

    回复 8月12日 · via netease

快报

更多

2023-12-09 21:54

取消燃油补贴、打击偷油,尼日利亚石油收入大增

2023-12-09 21:47

余承东:华为明年将推出颠覆性的产品,改写行业历史

2023-12-09 21:45

深圳全球招商大会引资总额超万亿元

2023-12-09 21:41

私募大佬看好对2024年股市前景,积极寻找底部投资机会

2023-12-09 21:40

“彩民独中2.2亿”热议未消,业内:彩票监管方面是有缺失的

2023-12-09 21:18

中国旅游研究院杨劲松:冰雪旅游正处在历史性爆发前夜

2023-12-09 21:08

国务院任命蒲淳为国家认证认可监督管理委员会主任

2023-12-09 20:59

近期降温降雪如何应对?北京市体育局、体育总会发布紧急通知

2023-12-09 20:54

上海市政府与世界知识产权组织在沪签署《关于加强在知识产权领域交流与合作的谅解备忘录》

2023-12-09 20:44

数据利好刺激纽约股市上涨,持续上涨动力不足

2023-12-09 20:24

12月9日新闻联播速览22条

2023-12-09 20:10

业内人士:MR产业有望进入新一轮上升周期

2023-12-09 19:51

国家疾控局发布关于印发预防呼吸道传染病公众佩戴口罩指引(2023年版)的通知

2023-12-09 19:19

中证REITs全收益指数四季度以来再度下跌12.63%

2023-12-09 19:16

海南省省长刘小明会见特斯拉客人

2023-12-09 19:03

交行副行长钱斌:生成式AI在算力算法、数据安全等领域面临痛点

2023-12-09 18:54

工银瑞信基金:纺织服装板块受关税影响下跌会带来更好投资机会

2023-12-09 18:50

大商所:推进钢铁、农林、化工、天气等领域产品研发工作

2023-12-09 18:46

雄安自贸试验区交流展示中心投用

2023-12-09 18:42

北京市长殷勇:聚焦人工智能等重点领域,构筑数字经济发展新优势

238
7
152

扫描下载APP