原生支持DeepSeek,国内70%部署企业基于昇腾快速上线

创新场景
DeepSeek火爆之后,大模型呈现“技术摸高+工程创新”并行发展趋势,算力需求仍将持续增长。

图片系AI生成

图片系AI生成

“服务器繁忙,请稍后再试。”这才是DeepSeek爆火之后输出最多的答案。

DeepSeek凭借算法优化显著降低了模型训练成本,如MoE架构、动态路由算法等,同时开源策略加速了大模型在垂直领域的渗透,由此带来了采用率的指数级增长,数据显示,DeepSeek的全球日活用户从34.7万飙升至1.19亿,仅用了一个月。

如何解决DeepSeek带来的算力焦虑,成了算力行业厂商的必答题,截至目前,包括昇腾、天数智芯、摩尔线程、壁仞科技、燧原科技、沐曦、海光等企业均已宣布适配DeepSeek。

据钛媒体App了解,国产芯片厂商的适配只是初级状态,达到了可用的程度,要想从更底层适配DeepSeek的算法,需要在FP8混合精度、多场景功耗平衡、软硬协同深度优化等方面持续投入。

DeepSeek导致算力分化:技术摸高与工程创新并行

业界专家表示,DeepSeek火爆之后,大模型呈现“技术摸高+工程创新”并行发展趋势,算力需求仍将持续增长。

技术摸高方面,头部企业坚定投入预训练基础模型创新,追逐Scaling Law,加速探索AGI。他们关注高效、稳定、开放的底座,极致性能、稳定可靠的AI集群,以及深度开放的平台和生态。

例如,Meta的AI投资从400亿美元增加到650亿美元,谷歌从525亿美元增加到750亿美元。同时,模型演进和技术迭代也在加速,如千问发布旗舰版模型Qwen 2.5 - Max,Google发布Gemini 2.0系列。

工程创新方面,新的范式降低了后训练和蒸馏的门槛,引发新一波的“百模千态”。企业关注便捷、易用、性价比的平台,兼顾成本与性能的蒸馏/微调方案,以及便捷的部署和敏捷业务上线。

在企业端(To B),各企业以冲刺方式接入DeepSeek获取流量。自R1发布后的20天内,国内外已有160多家企业集体接入DeepSeek。

在消费端(To C),用户呈爆炸式增长,超级APP快速出现,加速了LLM的全面普及。DeepSeek以现象级表现提升了社会对LLM的认知,促进了新商业模式的成型,实现了商业正循环。

因此,大模型算力也需要支撑同时支撑两方面的需求演进,具体来看,首先是,模型结构优化,用相同硬件支持更大的模型,提升模型的规模和性能。

其次是计算通信优化,提升算力利用率,缩短训练时间,让企业能够更高效地完成复杂的AI任务。

还有后训练优化,让企业无需大量标注数据,降低数据成本,同时通过强化学习等技术提升模型性能。

在推理优化层面,需要支持一次预测多个token,成倍提升推理效率,为企业提供更高效、更快速的AI应用体验。

据悉,绝大多数AI玩家需要依靠能够充分发挥有效算力的算力底座及完整的解决方案,实现高效训练和推理。稳定可靠的算力平台能够降低试错成本,让企业聚焦模型工程优化。

昇腾原生支持DeepSeek

钛媒体App获悉,DeepSeek发布V3之后,华为内部就启动了相关分析以及技术适配,并且发现,DeepSeek的技术路线和昇腾产品十分匹配。

例如MoE的架构,华为此前预判MoE是大模型的未来,到了R1发布,DeepSeek相当于“撸代码”的方式做强化学习,昇腾预研的开发强化学习套件,能够大幅简化强化学习过程。

据了解,昇腾是业界首个适配完成DeepSeek核心算法,支持DeepSeek全系模型预训练及微调的芯片平台,昇腾超节点支持DeepSeek全系模型预训练及微调,支持DualPipe、跨节点All2All等DeepSeek核心优化技术,超大带宽通信域更适合DeepSeek的流水线并行算法及冗余专家等能力。

同时,昇腾是业界唯一从预训练到微调全流程适配DeepSeek的AI训练平台,随着行业模型训练从SFT微调走向强化学习训练方式,昇腾提供DeepSeek R1模型及强化学习算法,结合提示工程及数据采样,可生成大量高质量合成数据。

昇腾联合伙伴/客户,推出了一体机、云服务、硬件+开源社区等产品形态,帮助企业快速部署,已覆盖互联网、金融、运营商、政务、教育等多个行业。其中,昇腾DS一体机超大系统吞吐,超高多用户并发,30+软硬件伙伴选择昇腾推出一体机方案。

据了解,目前各行业已有80多家客户/伙伴已基于昇腾快速适配/上线DeepSeek系列模型并对外提供服务,20多家企业适配测试中(预计两周内全部上线)。据一位接近昇腾的业内专家表示:“总体来说,国内70%的企业都基于昇腾快速上线。”(本文首发于钛媒体APP,作者 | 张帅,编辑 | 盖虹达)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

快报

更多

17:38

美团2025年财报:全年收入3649亿元,核心本地商业亏损69亿元

17:37

“沪七条”新政满月,上海楼市交易活跃

17:29

华东医药:全资子公司注射用HDM2024获临床试验批准

17:26

化肥价格上涨,美国豆农种植成本攀升

17:25

中方警戒舰目前正处于霍尔木兹海峡附近?国防部回应:假消息

17:24

百融云:2025年年内溢利7387万元,同比下降72%

17:22

小马智行:2025年总营收6.29亿元,同比增长20%

17:21

江南高纤:主要原材料及产品价格有所上涨,主营业务、盈利能力及毛利率未发生重大变化

17:18

泡泡玛特:耗资约6亿港元回购394万股

17:15

中国自2026年4月1日起对刚果(布)实施共同发展经济伙伴关系协定早期收获安排协定税率

17:08

李强签署国务院令,公布修订后的《全国农业普查条例》

17:07

国家外汇局:2025年末我国银行业对外金融资产19775亿美元

17:07

海南封关百日来,外贸进出口超800亿元,同比增长32.9%

17:06

小马智行:计划2026年在超20座城市部署3000辆Robotaxi

17:06

市场监管总局召开网络平台食品安全行政指导会

17:04

重庆市委书记袁家军会见宇树科技董事长王兴兴一行

17:03

李云泽会见瑞士再保险集团首席执行官安博思

16:56

广东证监局联合省委金融办、省国资委召开广东债券市场高质量发展培训交流会

16:54

广东多地优化调整住房公积金政策措施

16:47

中兴今年或推出龙虾手机

扫描下载App