原生支持DeepSeek,国内70%部署企业基于昇腾快速上线

创新场景
DeepSeek火爆之后,大模型呈现“技术摸高+工程创新”并行发展趋势,算力需求仍将持续增长。

图片系AI生成

图片系AI生成

“服务器繁忙,请稍后再试。”这才是DeepSeek爆火之后输出最多的答案。

DeepSeek凭借算法优化显著降低了模型训练成本,如MoE架构、动态路由算法等,同时开源策略加速了大模型在垂直领域的渗透,由此带来了采用率的指数级增长,数据显示,DeepSeek的全球日活用户从34.7万飙升至1.19亿,仅用了一个月。

如何解决DeepSeek带来的算力焦虑,成了算力行业厂商的必答题,截至目前,包括昇腾、天数智芯、摩尔线程、壁仞科技、燧原科技、沐曦、海光等企业均已宣布适配DeepSeek。

据钛媒体App了解,国产芯片厂商的适配只是初级状态,达到了可用的程度,要想从更底层适配DeepSeek的算法,需要在FP8混合精度、多场景功耗平衡、软硬协同深度优化等方面持续投入。

DeepSeek导致算力分化:技术摸高与工程创新并行

业界专家表示,DeepSeek火爆之后,大模型呈现“技术摸高+工程创新”并行发展趋势,算力需求仍将持续增长。

技术摸高方面,头部企业坚定投入预训练基础模型创新,追逐Scaling Law,加速探索AGI。他们关注高效、稳定、开放的底座,极致性能、稳定可靠的AI集群,以及深度开放的平台和生态。

例如,Meta的AI投资从400亿美元增加到650亿美元,谷歌从525亿美元增加到750亿美元。同时,模型演进和技术迭代也在加速,如千问发布旗舰版模型Qwen 2.5 - Max,Google发布Gemini 2.0系列。

工程创新方面,新的范式降低了后训练和蒸馏的门槛,引发新一波的“百模千态”。企业关注便捷、易用、性价比的平台,兼顾成本与性能的蒸馏/微调方案,以及便捷的部署和敏捷业务上线。

在企业端(To B),各企业以冲刺方式接入DeepSeek获取流量。自R1发布后的20天内,国内外已有160多家企业集体接入DeepSeek。

在消费端(To C),用户呈爆炸式增长,超级APP快速出现,加速了LLM的全面普及。DeepSeek以现象级表现提升了社会对LLM的认知,促进了新商业模式的成型,实现了商业正循环。

因此,大模型算力也需要支撑同时支撑两方面的需求演进,具体来看,首先是,模型结构优化,用相同硬件支持更大的模型,提升模型的规模和性能。

其次是计算通信优化,提升算力利用率,缩短训练时间,让企业能够更高效地完成复杂的AI任务。

还有后训练优化,让企业无需大量标注数据,降低数据成本,同时通过强化学习等技术提升模型性能。

在推理优化层面,需要支持一次预测多个token,成倍提升推理效率,为企业提供更高效、更快速的AI应用体验。

据悉,绝大多数AI玩家需要依靠能够充分发挥有效算力的算力底座及完整的解决方案,实现高效训练和推理。稳定可靠的算力平台能够降低试错成本,让企业聚焦模型工程优化。

昇腾原生支持DeepSeek

钛媒体App获悉,DeepSeek发布V3之后,华为内部就启动了相关分析以及技术适配,并且发现,DeepSeek的技术路线和昇腾产品十分匹配。

例如MoE的架构,华为此前预判MoE是大模型的未来,到了R1发布,DeepSeek相当于“撸代码”的方式做强化学习,昇腾预研的开发强化学习套件,能够大幅简化强化学习过程。

据了解,昇腾是业界首个适配完成DeepSeek核心算法,支持DeepSeek全系模型预训练及微调的芯片平台,昇腾超节点支持DeepSeek全系模型预训练及微调,支持DualPipe、跨节点All2All等DeepSeek核心优化技术,超大带宽通信域更适合DeepSeek的流水线并行算法及冗余专家等能力。

同时,昇腾是业界唯一从预训练到微调全流程适配DeepSeek的AI训练平台,随着行业模型训练从SFT微调走向强化学习训练方式,昇腾提供DeepSeek R1模型及强化学习算法,结合提示工程及数据采样,可生成大量高质量合成数据。

昇腾联合伙伴/客户,推出了一体机、云服务、硬件+开源社区等产品形态,帮助企业快速部署,已覆盖互联网、金融、运营商、政务、教育等多个行业。其中,昇腾DS一体机超大系统吞吐,超高多用户并发,30+软硬件伙伴选择昇腾推出一体机方案。

据了解,目前各行业已有80多家客户/伙伴已基于昇腾快速适配/上线DeepSeek系列模型并对外提供服务,20多家企业适配测试中(预计两周内全部上线)。据一位接近昇腾的业内专家表示:“总体来说,国内70%的企业都基于昇腾快速上线。”(本文首发于钛媒体APP,作者 | 张帅,编辑 | 盖虹达)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

快报

更多

13:25

知情人士称瑞银首席执行官Sergio Ermotti计划于2027年4月卸任

13:19

中国科研团队在高性能钠离子电池正极材料研发获重要进展

13:11

教育部:拟设黑龙江农业工程职业技术大学等14所本科高等学校

13:07

沪深两市成交额连续第7个交易日突破2.5万亿

13:06

投行IPO业务“阶梯式收费”的案例数量大幅减少,混合收费模式成为主流

13:05

2025年逾1万家银行网点关闭,降本增效同时还需做好服务

13:05

业内人士:差异化并购等方式可降低半导体并购重组失败风险

13:03

第六批国家高值医用耗材集采首轮报价唱标结束

13:03

工信部:中国大宗工业固废综合利用率达到57%,将推动工业固体废物综合利用“一降一升”

13:02

腾达科技:于1月13日对全部产品进行价格上调

12:58

锡装股份:公司产品尚未直接应用在航天火箭的燃料储运领域

12:56

4199元一瓶的茅台上线首日被秒空,酒商保持观望

12:53

A股市场两融交易额再度超过4000亿元

12:52

问界未来两年销量目标年均50万辆

12:51

美联储三名前主席耶伦、伯南克、格林斯潘谴责特朗普政府对鲍威尔展开刑事调查

12:47

香港特区第八届立法会明日举行首次会议

12:45

“大空头”警告:科技巨头赚取巨额利润的时代将终结,AI时代的关键指标是ROIC

12:39

机构:2025年全球智能手机出货量连续第二年实现增长,同比增长2%

12:38

Meta聘请前特朗普顾问担任高管,获特朗普发帖祝贺

12:37

英国官员:若X平台不采取行动,英国可对其处以罚款并封锁访问

扫描下载App