【科股一线拆解】幻方DeepSeek仅用557.6万美元训练成本做出对标GPT-4o能力大模型,企业算力减法冲动下是否应该担心算力过剩?

DeepSeek AI正式发布其最新大型语言模型——DeepSeek-V3,完全开源,在多项基准测试中,V3性能直接与Claude 3.5 Sonnet、GPT-4o相匹敌,但总训练成本仅为557.6万美元。

12月26日,DeepSeek AI正式发布其最新大型语言模型——DeepSeek-V3,完全开源,并且附送53页pdf技术论文。

综合评估表明,DeepSeek-V3的性能已经位列开源第一,并且达到了与领先的闭源模型相当的性能,在多项基准测试中,V3性能直接与Claude 3.5 Sonnet、GPT-4o相匹敌。在数学代码方面,DeepSeek-V3完全跑赢GPT-4o。
DeepSeek-V3各种基准测试结果,数据来源:DeepSeek-V3技术报告

DeepSeek-V3各种基准测试结果,数据来源:DeepSeek-V3技术报告

DeepSeek-V3完整训练的总成本仅为2.788百万GPU小时,假设H800 GPU的租赁价格为每GPU小时2美元,总训练成本仅为557.6万美元(不包括与架构、算法或数据的前期研究和消融实验相关的成本)。
DeepSeek-V3训练成本,数据来源:DeepSeek-V3技术报告

DeepSeek-V3训练成本,数据来源:DeepSeek-V3技术报告

一方面各家大厂都在增加AI相关的资本开支,另一方面各家也都有节省算力、节约成本的冲动,本次DeepSeek-V3以低成本完成高质量模型能力训练后,市场也再次传出算力是否过剩的担忧。

业内人士判断表示,算力市场呈现“短期够用,长期短缺”。

全文解读如下:

单篇付费 ¥19.90 可解锁全文
单篇解锁
科股宝VIP由钛媒体App与北京商报联合推出,相关数据及信息已获得北京商报授权。 风险提示:本产品内容仅供参考,不构成投资建议。投资有风险,入市需谨慎。
科股一线拆解

快报

更多

2026-04-26 22:51

DeepSeek输入缓存降价

2026-04-26 22:45

江苏博云:控股股东及股东拟协议转让23%公司股份

2026-04-26 22:26

博纳影业:2025年净亏损14.64亿元

2026-04-26 22:25

特朗普与英国首相通话,强调需要恢复霍尔木兹海峡航运

2026-04-26 22:21

黑芝麻及前董事长突遭证监会立案调查,交棒期陷信披危机

2026-04-26 22:06

下周(4月27日-5月3日)市场大事预告

2026-04-26 22:01

伊朗外长阿拉格齐抵达巴基斯坦伊斯兰堡

2026-04-26 21:30

中金:公募机构的券商持仓比例已近历史低点

2026-04-26 21:28

伊朗外长离开阿曼马斯喀特前往巴基斯坦

2026-04-26 21:28

白宫记协晚宴安全事件后,特朗普再提白宫宴会厅建设

2026-04-26 21:13

以军在本轮美以伊冲突期间在阿联酋部署“铁穹”防空系统

2026-04-26 21:09

伊朗高官:通过霍尔木兹海峡的船只必须缴费

2026-04-26 21:05

国家超算互联网上线DeepSeek-V4 API调用服务

2026-04-26 20:56

再迎春假连休,五一多地出游预订人次同比增长翻番

2026-04-26 20:46

白宫记协晚宴安全事件嫌疑人将于27日被起诉

2026-04-26 20:14

商务统计与经济计量系创始人刁锦寰逝世,享年93岁

2026-04-26 20:11

4月26日新闻联播速览25条

2026-04-26 20:06

伊朗外长呼吁建立“不受美国干预”的集体安全机制

2026-04-26 19:47

九鼎投资:下修2025年净利润至亏损3.4亿元-3.7亿元,股票可能被实施退市风险警示

2026-04-26 19:39

中国自主建造最大LNG运输船交付,由招商船舶海门基地建造

扫描下载App