2024CTIS-文章详情页顶部

马斯克打脸OpenAI!全球最大模型Grok-1开源,高达3140亿参数震撼世界|钛媒体AGI

这是有史以来最大的开源大模型,参数尺寸是Meta llama2的4倍以上。

 马斯克参加纽约时报活动(来源:视频截图)

就在刚刚,马斯克(Elon Musk)真的实现了他的承诺——把大模型Grok-1开源了。

钛媒体App获悉,北京时间3月18日早上,“硅谷钢铁侠”、亿万富翁马斯克旗下 AI 初创公司 xAI 宣布,其研发的大模型Grok-1正式对外开源开放,用户可直接通过磁链下载基本模型权重和网络架构信息。

xAI表示,Grok-1 是一个由 xAI 2023 年 10 月使用基于 JAX 和 Rust 的自定义训练堆栈、从头开始​​训练的3140亿参数的混合专家(MOE)模型,远超OpenAI的GPT模型。而此次开源的模型是是 Grok-1 预训练阶段的原始基础模型,没有针对任何特定应用(例如对话)进行微调。

对此,英伟达科学家Jimfan评价称,这是有史以来最大的开放大型语言模型,由世界级团队训练,通过磁力链接发布。Apache 2.0。 314B,专家混合(8 个活跃中的 2 个)。就连活动参数仅(86B)就超过了最大的Llama。迫不及待地想看到基准测试结果以及人们用它构建的内容。

langchain的Andrew Kean Gao评论认为,“Grok是有史以来最大的开源大模型,是llama2尺寸的4倍。”

ChatGPT则和马斯克在评论区互相嘲讽。

马斯克随后发推文表示,“告诉我们更多有关 OpenAI 的‘开放’部分的信息”。他直言,xAI 这个平台“已经是迄今为止最透明和最求真的平台(说实话,门槛并不高)”。

截至发稿前,Grok上线GitHub后狂揽了6000星,586个Fork。

据悉,2023年7月,特斯拉CEO马斯克宣布成立一家新的人工智能公司xAI,新公司使命是“了解宇宙的真实本质”,目标是打造OpenAI的竞争对手。

作为OpenAI 创始人之一,也是最新的OpenAI批评者,马斯克此前已表示,OpenAI已偏离了其预期目的,成为了一个以利润为导向的实体。他直言,OpenAI 最初是作为一个非营利性开源组织创建的,目的是抗衡谷歌。但此后它变成了微软控制下的一家闭源、以利润为导向的公司。“OpenAI 已经成为一家利润最大化的公司……这根本不是他的初衷。”

马斯克还谴责 OpenAI 遭到微软的控制。他表示,世界需要一个替代GPT的 AI 技术选择。

去年11月,马斯克正式发布xAI 旗下首个大模型和应用成果方案Grok,并将Grok AI 助手内置在社交平台X上。马斯克曾表示,“在某些方面,它是目前存在的最好的(AI 技术)。”

当时马斯克表示,调优之后的Grok大模型具有330亿个参数,性能基准上接近Llama 2 -70B,在HumanEval编码任务、MMLU 基准上的结果分别为63.2%、73%。

今年2月,马斯克向美国旧金山高等法院提起诉讼,起诉OpenAI和公司联合创始人、CEO奥特曼(Sam Altman),公司总裁Greg Brockman以及 OpenAI 的若干实体,控告OpenAI团队违约、出尔反尔(“允诺禁反言”)、不正当竞争等。

马斯克在46页、1.4万字诉讼文件中声称,OpenAI违背初衷,背叛了OpenAI这家 AI 公司成立时达成的一项协议,即开发技术的目的是“造福人类”而非利润。他认为,OpenAI最近与微软的密切关系损害了该公司最初对开放、开源通用人工智能(AGI)领域的贡献,他要求OpenAI开放技术并寻求偿还他提供的资金。

3月初,OpenAI“反击”称,“当创始团队讨论以营利为目的的结构以进一步实现使命时,马斯克希望我们与特斯拉合并,否则他想要完全控制。马斯克离开了 OpenAI,表示需要有一个与 Google/DeepMind 相关的竞争对手,而他将自己做这件事。他说他会支持我们找到自己的道路。”而且该公司驳回马斯克的所有主张,并称为事情发展到这一步感到遗憾。

马斯克则直接回应,OpenAI并不开源,Grok要直接开源(Open)。

如今,Grok-1 正式开源,其拥有3140亿参数,具备先进MOE架构,远超GPT-3.5、llama2等,是迄今为止参数量最大的开源大语言模型。

xAI称,这个版本包含了Grok-1在2023年10月完成预训练阶段时的基础模型数据。根据Apache 2.0许可协议,向公众开放模型的权重和架构。以下是钛媒体App梳理的关键信息:

  • 该基础模型通过大量文本数据训练而成,未专门针对任何具体任务进行优化。
  • 3140亿参数构成的混合专家模型,其中25%的参数能够针对特定的数据单元(Token)激活。而xAI团队利用定制的训练技术栈,在JAX和Rust的基础上,从零开始构建了此模型,完成时间为2023年10月。
  • 模型参数数量高达3140亿,具备混合专家模型(Mixture of Experts, MoE)8架构,每一个数据单元(Token)由2位专家处理,共64个处理层,用于处理查询的有48个注意力机制单元(attention heads),用于处理键(key)/值(value)的有8个注意力机制单元,嵌入向量(embeddings)的维度为6,144,采用旋转式嵌入表示( RoPE) ,使用SentencePiece分词系统处理,包含131,072种数据单元,支持激活数据分布计算(activation sharding)和8位数字精度量化(8-bit quantization)
  • 最大序列长度为8,192个数据单元,以处理更长的上下文信息

纽约时报点评道,开源Gork背后的原始代码,是这个世界上最富有的人控制AI未来战斗的升级。

Meta CEO扎克伯格刚刚也对Grok做出了评价:“并没有给人留下真正深刻的印象,3140亿参数太多了,你需要一堆H100,不过我已经买下了”。

值得一提的是,近期南加州大学的论文称,OpenAI发布的GPT-3.5-turbo 的参数规模也在7B(70亿)左右,除非是MoE 架构可能不同,并估计 gpt-3.5-turbo 的嵌入大小为 4096,称花费不到 1000 美元就把最新版 gpt-3.5-turbo 模型的机密给挖了出来。

有网友形容,马斯克对于模型技术这么大方,中国企业终于有福了。

3月17日,北京师范大学新闻传播学院教授、北京师范大学传播创新与未来媒体实验平台主任 喻国明在一场演讲中表示,别人一开源中国 AI 模型就使用是不正确的做法,对于安全性有所影响,必须国内要解决数据开源的规则问题。同时,大模型算力不足下,中国不应该“一窝蜂”做300多个大模型,而是应该做一些垂直行业、边缘计算的小模型,从而解决实际应用问题。

“模型的价值不在于数据、算法、算力的大小,而在于能否为人创造真正的价值大小,并且在价值链条中扮演关键角色。价值的最终实现,取决于大模型与小模型之间的融合与协同。”喻国明表示。

(本文首发钛媒体App,作者|林志佳)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 是博人眼球吧。

    回复 3月18日 · via iphone
  • 别瞎操心了。人家的想法没人懂。

    回复 3月18日 · via iphone
  • 马斯克要用3140亿美元,开个大模型,是真有钱啊。

    回复 3月18日 · via iphone
  • 这个想法独特,不是说美政府欠钱了吗,怎么弄啊

    回复 3月18日 · via h5
  • 说是他弄了个间谍卫星网给美国用,很厉害。

    回复 3月18日 · via android
  • 不知道是怎么想的。玩钱呗。

    回复 3月18日 · via iphone
  • 这就是想法独特,赚政府的钱。

    回复 3月18日 · via pc

快报

更多

2024-04-28 22:51

中钢协:建议尽快尽早出台产量控制政策,抑制进口铁矿石等原燃材料价格非理性大幅度上涨

2024-04-28 22:45

国内“五一”假期租车市场强劲增长,预订率预计超90%

2024-04-28 22:43

22家央企面向全球发布“培育未来产业 发展新质生产力”倡议书

2024-04-28 22:35

8只黄金股披露一季报,紫金矿业Q1净利超60亿元

2024-04-28 22:13

下周(4月29日-5月5日)市场大事预告

2024-04-28 21:57

中国太保与华为签署战略合作协议

2024-04-28 21:45

特斯拉:将继续深耕中国,加速清洁能源与自动驾驶技术落地

2024-04-28 21:09

字节跳动内部反腐辞退61人,收巨额“好处费”员工被刑拘

2024-04-28 21:08

俄罗斯宣布将从5月至8月暂时取消部分煤炭出口关税

2024-04-28 20:45

马斯克:特斯拉今年将在AI训练和推理方面投入约100亿美元

2024-04-28 20:28

上海浦东新区:2023年保税区域高新技术企业营收突破400亿元,同比增长17%

2024-04-28 20:27

高铜价导致部分下游加工厂缺少订单、选择放假

2024-04-28 20:24

重庆燃气:对有问题收费已全面清退

2024-04-28 20:22

酒鬼酒:一季度净利润7338.03万元,同比下降75.56%

2024-04-28 20:14

亿纬锂能:预计国内外大储市场全年将保持30%-50%增速

2024-04-28 20:13

我国独角兽企业已超360家,人工智能和集成电路领域数量领先

2024-04-28 20:10

国资委:对承担国家重大科技项目的科研团队工资总额实行单列

2024-04-28 20:07

4月28日新闻联播速览21条

2024-04-28 20:05

晋能控股集团有限公司原副董事长李鸿双接受审查调查

2024-04-28 20:03

牧原股份:预计2024年全年生猪出栏区间为6600万头-7200万头

7

扫描下载App