科学家们“造”了个新宇宙，却意外暴露了AI时代真正的瓶颈-钛媒体官方网站

距离“千衍”超大规模宇宙学模拟项目完成已过去一个月，但关于它的讨论仍在发酵。

核心观点围绕一个技术命题展开：在高性能计算与AI领域，存储正从配角变为决定系统性能的瓶颈与关键支点。

此前，“千衍”项目已于今年4月正式发布，简单一点来说，是科学家们一个用超级计算机模拟宇宙演化的科研项目。它追踪了4.2万亿个暗物质粒子，在120亿光年的空间尺度上，重现了宇宙百亿年的变化过程，帮助科学家研究暗物质和暗能量。

对此，我们与项目负责人王乔研究员，以及中科曙光高级副总裁李斌进行深入的交流。他们的回答指向同一个方向：存算一体不再只是理论设想，而是当前算力突围必须面对的现实课题。

存储已经跟不上计算的强大了？

在“千衍”项目中，团队完成了一次计算实验：生成13PB数据，模拟120亿光年宇宙尺度下4.2万亿暗物质质点的百亿年演化。

项目负责人王乔回忆，团队最初尝试用国际成熟软件在超算上运行，但测试两年始终跑不起来。因为支撑项目的不仅是极致的算力，更需要与之匹配的高性能存储系统，来承载模拟过程中产生的海量数据。

王乔作为从0到1看着“千衍”项目一步步走到如今的研究人员，分享了“千衍”项目一路走来的历程，他表示，起初，他们尝试使用国际上成熟的软件在大规模超算上运行，“第一次我们一开始就是这么想的，找个成熟的软件拿过来放心。但是后来发现，也差不多测试了两年，发现根本就跑不起来，整个这个事情就走不下去了。”王乔回忆道，从其他超算切换到曙光的架构，这背后是无数次排查、调试和重写代码的深夜。

为什么其他超算最终未能承载“千衍”？关键不在于算力规模，而在于架构匹配。项目前期使用的超算采用的是主从核架构，其核心优势在于规模庞大、算力强劲，但致命的短板的是内存偏小——这与“千衍”项目的需求形成了尖锐的矛盾。“我们的模拟需要同时处理海量演化数据，这些数据首先要能‘装得下’，才能‘算得动’。”王乔指出，而曙光的大内存架构恰恰契合了天文模拟的需求。最终，“千衍”在中科院网络中心的东方超算上使用了上亿CPU核时与千万加速卡时，完成了模拟计算。

透过“千衍”项目的经历，可以窥见当前高性能计算的一个技术趋势：在今天的AI和科学计算中，性能的瓶颈正在从计算单元本身，向存储和数据搬运环节迁移。这个转变不是渐进的，而是结构性的。王乔的团队遇到的直接障碍是——当GPU和CPU的计算能力持续飙升时，数据的读写和传输却卡住了整个链条的运转。“在存储这一块、数据这一块是一个非常重要的事儿，之前大家关注得并没有那么多，”王乔坦言，“但它必须是在一个高速存储上面，否则就处理不完了，我们实际上需要一个非常快的处理方式才能解决。”

而这只是行业的一个缩影，当前无论是高性能计算领域，还是智算领域，都普遍存在一个困境，那就是“计算核心越来越强大，但数据搬不动了”。美国德克萨斯大学奥斯汀分校教授Mike Boylan-Kolchin将“千衍”称为一项“计算奇迹”，德国马普天体物理研究所所长Volker Springel则认为它“刷新了当前数值宇宙学的发展极限”。在这些赞誉背后，真正支撑起这一奇迹的，恰恰是一套能够将存储性能推到极限的高端全闪存储系统。

存力为何可能成为终极制高点？

天文领域的极端案例并非孤例。当2025年中国分布式存储市场规模首次超越集中式存储达到198.2亿元，同比增长43.7%时，全闪存存储占比已提升至24.1%，成为市场增长的核心引擎。而全球超算市场规模也将在2026年突破186.7亿美元，以19.3%的年增速扩张。这个高速增长的市场，正在催生一种全新的技术理念——存算一体不再只是实验室里的论文选题，而成为决定产业落地的核心命题。

在AI产业的另外一侧，同样的存算张力正以更激进的姿态上演。当大模型服务需要每日处理数百TB甚至PB级KV缓存数据时，数据搬动本身的能耗和延迟已经让传统架构捉襟见肘。郑纬民院士在吉林大学的讲座中明确指出，每个token对应的KV-Cache可达数十KB，大规模服务中每日需处理数百TB甚至PB级缓存数据，对存储系统和传输速度提出极高要求。

在这种背景下，“以存储换计算”的思路开始进入主流视野：将KV cache从GPU显存卸载到存储介质，通过存储系统的性能换取计算效率的提升。这与“千衍”项目中王乔团队对存储性能的极致追求，实际上是同一个技术命题的两面——数据搬不动了，存储必须扛起来。

而这也是为什么近年来众多做存储的厂商都在布局“存算一体”的根本原因。存算一体的核心要义，在于打破计算与存储之间的壁垒，实现数据“就近计算、高效流转”，从而解决传统高性能计算架构中“算力闲置、存储拥堵”的痛点。假如把算力比作AI时代的引擎，那么存力就是这颗引擎的燃油系统。引擎马力再强，如果燃油送不进去，一切都是徒劳。

对于“千衍”这样的超大规模科研项目而言，存算协同不仅是提升运算效率的关键，更是实现项目目标的前提。

与此同时，中科曙光高级副总裁李斌给出了一个耐人寻味的判断：“现在人工智能来了之后，其实对存储系统本身提出了很高的要求，但是另外一方面也是未来可能会重塑未来存储的一些发展技术方向。”这句话的潜台词是：AI对存储的改变不是锦上添花，而是釜底抽薪。

存储行业的价值跃升，在更宏观的产业层面有着更加直观的体现。2025年第二季度起，全球存储芯片价格开启了罕见的超级周期。TrendForce数据显示，2025年第四季度DRAM合约价较去年同期已上涨逾75%。进入2026年，涨价势头未见缓解——2026年全球生产的DRAM中高达70%将被数据中心消耗，到2028年的产能已被预订完毕。支撑这场超级周期的，不仅仅是产能不足的传统逻辑，更是AI训练和推理对内存和存储的结构性需求。存储正在从一个以产能周期驱动的周期性行业，转变为一个由AI需求增长驱动的长期成长行业。

更深层次的变革来自于存储的“角色升级”。在传统计算架构中，存储是被动的数据容器，CPU告诉它“给我数据”，它就把数据取出来递过去。但在AI驱动的计算范式中，存储正在从“容器”升级为“数据引擎”。这意味着，在未来的AI推理架构中，存储将不仅仅是数据的保管者，更将是计算过程的积极参与者，需要其具备主动理解数据语义，主动优化数据布局，主动配合算力调度的能力。

这正是存算一体的本质。它不是在芯片层面将计算和存储合二为一，而是在系统架构层面，让两个环节从前端到后端实现深度协同。在千衍项目中，这种协同以另一种方式体现：计算系统负责模拟数万亿粒子的引力演化，存储系统则保障海量数据的高效写入与读取，两者之间的数据传输被优化到了极致。

高性能存储成必备品

“千衍”项目的成功，不仅是一个科研项目的突破，更预示着高性能计算领域的发展进入了高性能存储时代。

高性能计算领域对存算一体的需求，已经从“基础协同”向“深度融合”升级。传统的存算协同，更多是实现存储与算力的硬件适配，而未来的存算一体，将实现软件与硬件的深度融合，存储系统不仅能够提供数据存储和读写服务，还能够承担部分计算任务，实现“存储即计算”。“千衍”项目的实践，已经为这种深度融合提供了很好的范例——曙光的存储系统通过支持KV cache远端卸载、原生KV语义等技术，承担了部分AI推理过程中的计算任务，减轻了GPU的显存压力，提升了整个系统的运算效率。

对此，李斌表示：“AI时代的高性能计算，是一个算力、存力、网络高度紧耦合的系统。存算一体的核心，就是打破原有技术边界，实现有机协同。”

从趋势上看，国内存储行业需要主要有三个趋势：一是高性能化，随着科研场景的升级，存储系统的读写速度、容量上限将持续提升，以满足PB级、EB级数据的存储与处理需求；二是智能化，存储系统将引入AI技术，实现数据的智能管理、智能调度和智能优化，提升系统的运行效率和可靠性；三是国产化，随着国产替代的不断推进，高性能存储的核心部件、软件系统将逐步实现自主可控，构建完整的国产生态。

“千衍”下一步也契合这一方向。王乔介绍，丰富模拟的物理内容，并引入AI优化算法、挖掘数据将成为“千衍”未来的发展方向，“AI4S是未来科研的重要方向”。

如果说“千衍”是对存算极限的一次极端测试，那么AI产业对存力的渴求则是更广泛的压力测试。存储，正从算力竞赛的“后勤部门”升级为“战略前线”。

（文｜Leo张ToB杂谈，作者｜张申宇，编辑丨杨林）