华为团队回应盘古开源AI模型抄袭争议:并非基于其他模型增量训练,已严格遵循开源许可

AGI
多位开源行业专家曾对笔者表示,使用开源项目主要关注两点:一是要声明原作者是谁,要遵循开源项目里的开源协议、作者声明,不能修改且不能删除;二是关注项目的商业化界限,有些项目可用于商业化,还有一些项目不允许商业化、二次开发等,这需要开发者重新沟通和评估。

经历一天行业热议后,华为AI大模型研究团队如今终于回应盘古开源模型被质疑套壳抄袭争议。

7月5日下午,华为旗下AI大语言模型盘古Pro MoE技术开发团队“诺亚方舟实验室”发布了一份声明,称盘古 Pro MoE开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来。

“我们注意到近期开源社区及网络平台关于盘古大模型开源代码的讨论。盘古 Pro MoE 开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来,在架构设计、技术特性等方面做了关键创新,是全球首个面向昇腾硬件平台设计的同规格混合专家模型,创新性地提出了分组混合专家模型(MoGE)架构,有效解决了大规模分布式训练的负载均衡难题,提升训练效率。其他技术特性创新,请参考昇腾生态竞争力系列技术报告披露内容。”华为盘古团队表示。

盘古团队指出,“盘古 Pro MoE 开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。”

盘古Pro MoE技术开发团队强调,团队始终坚持开放创新,尊重第三方知识产权,同时提倡包容、公平、开放、团结和可持续的开源理念。感谢全球开发者与合作伙伴对盘古大模型的关注和支持,团队高度重视开源社区的建设性意见。希望通过盘古大模型开源,与志同道合的伙伴一起,探索并不断优化模型能力,加速技术突破与产业落地。

据悉,诺亚方舟实验室是华为公司于2012年设立的人工智能研究机构,聘用全球科研人员从事基础研究。该实验室通过迁移学习等技术创新,为盘古大模型等重大项目提供核心算法支持。目前,诺亚方舟实验室主要负责华为盘古大语言模型(LLM)系列研发工作。

2021年,华为云发布了盘古系列预训练大模型,包括NLP(自然语言)大模型、CV(视觉)大模型、科学计算大模型。

今年6月21日,华为云发布盘古大模型5.0,包含不同参数规格的模型,如十亿级参数的Pangu E系列可支撑手机、PC等端侧的智能应用;百亿级参数的Pangu P系列,适用于低时延、低成本的推理场景;以及千亿级参数的Pangu U系列、万亿级参数的Pangu S系列超级大模型等,帮助企业更好地在全场景应用AI技术。

6月30日,华为公司宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于昇腾的模型推理技术,并对外公布相关研究论文。对此,华为表示,此举是华为践行昇腾生态战略的又一关键举措,推动大模型技术的研究与创新发展,加速推进人工智能在千行百业的应用与价值创造。

但随后,华为盘古Pro MoE模型被质疑套壳抄袭阿里云通义千问Qwen-2.5 14B模型。

7月4日,一项发布于GitHub的研究指出,华为盘古Pro MoE 模型(总参数720亿)采用了LLM-Fingerprint(模型指纹技术),与阿里通义千问Qwen-2.5 14B模型的注意力参数分布存在高度相似性,平均相关性达0.927(接近完全一致的1.0),显著超出模型间正常差异范围,并指向“非独立开发”的可能性。

作者自称是哥斯达黎加大学的韩国学生。他在文中指出,盘古开源代码文件中发现标注“Copyright 2024 The Qwen team, Alibaba Group”,被质疑复制阿里代码时未删除版权声明。

截至发稿前,上述GitHub库已经删除。

对此,华为诺亚方舟实验室在最新声明中否认抄袭指控,并称此为引用开源组件,并进行了合规标注,符合开源协议要求。

该事件在过去一天引起广泛关注,社交平台上有很多讨论。知乎上多篇帖文指出,这个GitHub作者将大语言模型的每个transformer层的QKVO参数的标准差组合在一起形成特征向量,作者把这个模型叫做“指纹”,然后作者根据模型指纹计算大语言模型之间的距离,将其作为相似度。但这种逻辑方法不能衡量模型的相似度,而且本身使用参数标准差来判定并非科学手段。

截至发稿前,阿里Qwen方面暂时没有声明回应。但笔者了解到,多个大厂AI研究团队都在关注此事进展。

抄袭事件再次暴露出AI大模型开源定义模糊、协议规则与法律界定部分仍比较“模糊”、开源的模型与代码协议较为混乱等问题。

普遍而言,开源并不代表没有版权,任何第三方使用都应该遵循其开源许可协议,如果企业需要用开源代码进行商业化,需要与开源项目所有者进行授权或提交一定的费用。而在法律层面上,大模型所有者可以通过专利、商标、版权等方式保护自己的大模型知识产权。

多位开源行业专家曾对笔者表示,使用开源项目主要关注两点:一是要声明原作者是谁,你用的是哪个项目,而且要遵循开源项目里的开源协议、作者声明,不能修改且不能删除;二是关注项目的商业化界限,有些项目可用于商业化,还有一些项目不允许商业化、二次开发等,这需要开发者重新沟通和评估。

在此之前,零一万物开源大模型Yi-34B被质疑使用Meta LIama开源模型架构,斯坦福大学的Llama3-V项目曾套壳面壁智能研发的MiniCPM-Llama3-V 2.5、等事件,均引发开发者群体的关注。

未知资本常务董事william wong曾表示,很多初创公司后台接入ChatGPT,前端做了个UI设计就上架苹果商店鼓吹自己在做生成式AI创业了,他认为这种生成式AI项目没有技术壁垒和商业逻辑,只是“蹭热度”。

但随着今年开源AI模型DeepSeek-R1/V3风靡全球,自研底座大模型技术成本较高,很多AI模型和应用背后都有DeepSeek身影。因此,未来如何定义好开源AI模型边界,让开源技术更加健康有序发展,仍是行业亟待解决的重要课题。

据华为云称,过去一年中,盘古大模型已经在30多个行业、400多个场景中落地,在政务、金融、制造、医药研发、煤矿、钢铁、铁路、自动驾驶、工业设计、建筑设计、气象等领域发挥巨大价值。(本文首发于钛媒体App,作者|林志佳,编辑|盖虹达)

本文系作者 林志佳 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 华为硬刚抄袭质疑,昇腾硬件自研架构,这回应够硬核!

    回复 7月7日 · via iphone
  • 行业大佬都在围观,这瓜越吃越大!

    回复 7月7日 · via iphone
  • 开源代码标阿里版权,这操作到底咋回事?太迷惑了!

    回复 7月7日 · via iphone
  • 用参数相似度定罪,这逻辑太离谱!

    回复 7月7日 · via android
  • 韩国学生这波操作,是真打假还是蹭热度?

    回复 7月7日 · via android
  • 代码借鉴和抄袭,界限到底在哪?太模糊了!

    回复 7月7日 · via pc
  • 开源代码标别家版权,这锅该谁背?

    回复 7月7日 · via h5
  • 盘古大模型落地那么多场景,实力摆在这呢!

    回复 7月7日 · via iphone
  • 华为这波回应,能堵住质疑者的嘴吗?

    回复 7月7日 · via pc
  • 阿里咋还不回应?这波华为和阿里的模型之争有看头!

    回复 7月6日 · via iphone
更多评论

快报

更多

20:30

中国中医科学院:全球首个临床试验注册平台已发放注册号7697项

20:23

共达电声:控股股东拟协议转让5.24%公司股份

20:16

TCL科技:子公司TCL华星成功竞买福建兆元光电80%股权及相关债权,交易价格为4.9亿元

20:15

12月26日新闻联播速览21条

20:09

开勒股份:拟与杭州溯元共同投资1.2亿元设立合伙企业,聚焦半导体产业链投资

20:08

央行报告:着力健全有利于“长钱长投”的制度政策环境,显著提高各类中长期资金实际投资A股的规模和比例

20:05

中国人民银行发布《中国金融稳定报告(2025)》

20:04

北京证券交易所发布交易与关联交易指引

19:57

巴基斯坦KSE-100指数收盘上涨1%,报172,571.20点

19:53

立华股份:实控人及其一致行动人拟合计减持公司不超1.7%股份

19:53

天创时尚:控股股东将变更为安徽先睿,股票复牌

19:48

美芝股份:拟公开挂牌转让债权并进行债务重组

19:38

海南华铁:因重大合同临时公告披露不完整等,遭800万元行政处罚

19:35

东华能源:子公司出售含贵金属废催化剂资产,评估增值110.50%

19:31

长安汽车:L3获批车型经过大规模测试验证500万公里以上,无任何违规事件

19:26

读客文化:终止筹划控制权变更事项,股票将于29日复牌

19:24

锦江航运:拟不超19.4亿元投资建造4+4艘集装箱船舶

19:22

星源材质:拟注销241.35万股回购股份

19:22

国家发改委印发《低空经济及其核心产业统计分类(试行)》

19:21

妙可蓝多:公司无法实现并购基金中本金及相应收益的退出,存在产生重大损失的风险

35

扫描下载App