![]()
距离“千衍”超大规模宇宙学模拟项目完成已过去一个月,但关于它的讨论仍在发酵。
核心观点围绕一个技术命题展开:在高性能计算与AI领域,存储正从配角变为决定系统性能的瓶颈与关键支点。
此前,“千衍”项目已于今年4月正式发布,简单一点来说,是科学家们一个用超级计算机模拟宇宙演化的科研项目。它追踪了4.2万亿个暗物质粒子,在120亿光年的空间尺度上,重现了宇宙百亿年的变化过程,帮助科学家研究暗物质和暗能量。
对此,我们与项目负责人王乔研究员,以及中科曙光高级副总裁李斌进行深入的交流。他们的回答指向同一个方向:存算一体不再只是理论设想,而是当前算力突围必须面对的现实课题。
存储已经跟不上计算的强大了?
在“千衍”项目中,团队完成了一次计算实验:生成13PB数据,模拟120亿光年宇宙尺度下4.2万亿暗物质质点的百亿年演化。
项目负责人王乔回忆,团队最初尝试用国际成熟软件在超算上运行,但测试两年始终跑不起来。因为支撑项目的不仅是极致的算力,更需要与之匹配的高性能存储系统,来承载模拟过程中产生的海量数据。
王乔作为从0到1看着“千衍”项目一步步走到如今的研究人员,分享了“千衍”项目一路走来的历程,他表示,起初,他们尝试使用国际上成熟的软件在大规模超算上运行,“第一次我们一开始就是这么想的,找个成熟的软件拿过来放心。但是后来发现,也差不多测试了两年,发现根本就跑不起来,整个这个事情就走不下去了。”王乔回忆道,从其他超算切换到曙光的架构,这背后是无数次排查、调试和重写代码的深夜。
为什么其他超算最终未能承载“千衍”?关键不在于算力规模,而在于架构匹配。项目前期使用的超算采用的是主从核架构,其核心优势在于规模庞大、算力强劲,但致命的短板的是内存偏小——这与“千衍”项目的需求形成了尖锐的矛盾。“我们的模拟需要同时处理海量演化数据,这些数据首先要能‘装得下’,才能‘算得动’。”王乔指出,而曙光的大内存架构恰恰契合了天文模拟的需求。最终,“千衍”在中科院网络中心的东方超算上使用了上亿CPU核时与千万加速卡时,完成了模拟计算。
透过“千衍”项目的经历,可以窥见当前高性能计算的一个技术趋势:在今天的AI和科学计算中,性能的瓶颈正在从计算单元本身,向存储和数据搬运环节迁移。这个转变不是渐进的,而是结构性的。王乔的团队遇到的直接障碍是——当GPU和CPU的计算能力持续飙升时,数据的读写和传输却卡住了整个链条的运转。“在存储这一块、数据这一块是一个非常重要的事儿,之前大家关注得并没有那么多,”王乔坦言,“但它必须是在一个高速存储上面,否则就处理不完了,我们实际上需要一个非常快的处理方式才能解决。”
而这只是行业的一个缩影,当前无论是高性能计算领域,还是智算领域,都普遍存在一个困境,那就是“计算核心越来越强大,但数据搬不动了”。美国德克萨斯大学奥斯汀分校教授Mike Boylan-Kolchin将“千衍”称为一项“计算奇迹”,德国马普天体物理研究所所长Volker Springel则认为它“刷新了当前数值宇宙学的发展极限”。在这些赞誉背后,真正支撑起这一奇迹的,恰恰是一套能够将存储性能推到极限的高端全闪存储系统。
存力为何可能成为终极制高点?
天文领域的极端案例并非孤例。当2025年中国分布式存储市场规模首次超越集中式存储达到198.2亿元,同比增长43.7%时,全闪存存储占比已提升至24.1%,成为市场增长的核心引擎。而全球超算市场规模也将在2026年突破186.7亿美元,以19.3%的年增速扩张。这个高速增长的市场,正在催生一种全新的技术理念——存算一体不再只是实验室里的论文选题,而成为决定产业落地的核心命题。
在AI产业的另外一侧,同样的存算张力正以更激进的姿态上演。当大模型服务需要每日处理数百TB甚至PB级KV缓存数据时,数据搬动本身的能耗和延迟已经让传统架构捉襟见肘。郑纬民院士在吉林大学的讲座中明确指出,每个token对应的KV-Cache可达数十KB,大规模服务中每日需处理数百TB甚至PB级缓存数据,对存储系统和传输速度提出极高要求。
在这种背景下,“以存储换计算”的思路开始进入主流视野:将KV cache从GPU显存卸载到存储介质,通过存储系统的性能换取计算效率的提升。这与“千衍”项目中王乔团队对存储性能的极致追求,实际上是同一个技术命题的两面——数据搬不动了,存储必须扛起来。
而这也是为什么近年来众多做存储的厂商都在布局“存算一体”的根本原因。存算一体的核心要义,在于打破计算与存储之间的壁垒,实现数据“就近计算、高效流转”,从而解决传统高性能计算架构中“算力闲置、存储拥堵”的痛点。假如把算力比作AI时代的引擎,那么存力就是这颗引擎的燃油系统。引擎马力再强,如果燃油送不进去,一切都是徒劳。
对于“千衍”这样的超大规模科研项目而言,存算协同不仅是提升运算效率的关键,更是实现项目目标的前提。
与此同时,中科曙光高级副总裁李斌给出了一个耐人寻味的判断:“现在人工智能来了之后,其实对存储系统本身提出了很高的要求,但是另外一方面也是未来可能会重塑未来存储的一些发展技术方向。”这句话的潜台词是:AI对存储的改变不是锦上添花,而是釜底抽薪。
存储行业的价值跃升,在更宏观的产业层面有着更加直观的体现。2025年第二季度起,全球存储芯片价格开启了罕见的超级周期。TrendForce数据显示,2025年第四季度DRAM合约价较去年同期已上涨逾75%。进入2026年,涨价势头未见缓解——2026年全球生产的DRAM中高达70%将被数据中心消耗,到2028年的产能已被预订完毕。支撑这场超级周期的,不仅仅是产能不足的传统逻辑,更是AI训练和推理对内存和存储的结构性需求。存储正在从一个以产能周期驱动的周期性行业,转变为一个由AI需求增长驱动的长期成长行业。
更深层次的变革来自于存储的“角色升级”。在传统计算架构中,存储是被动的数据容器,CPU告诉它“给我数据”,它就把数据取出来递过去。但在AI驱动的计算范式中,存储正在从“容器”升级为“数据引擎”。这意味着,在未来的AI推理架构中,存储将不仅仅是数据的保管者,更将是计算过程的积极参与者,需要其具备主动理解数据语义,主动优化数据布局,主动配合算力调度的能力。
这正是存算一体的本质。它不是在芯片层面将计算和存储合二为一,而是在系统架构层面,让两个环节从前端到后端实现深度协同。在千衍项目中,这种协同以另一种方式体现:计算系统负责模拟数万亿粒子的引力演化,存储系统则保障海量数据的高效写入与读取,两者之间的数据传输被优化到了极致。
高性能存储成必备品
“千衍”项目的成功,不仅是一个科研项目的突破,更预示着高性能计算领域的发展进入了高性能存储时代。
高性能计算领域对存算一体的需求,已经从“基础协同”向“深度融合”升级。传统的存算协同,更多是实现存储与算力的硬件适配,而未来的存算一体,将实现软件与硬件的深度融合,存储系统不仅能够提供数据存储和读写服务,还能够承担部分计算任务,实现“存储即计算”。“千衍”项目的实践,已经为这种深度融合提供了很好的范例——曙光的存储系统通过支持KV cache远端卸载、原生KV语义等技术,承担了部分AI推理过程中的计算任务,减轻了GPU的显存压力,提升了整个系统的运算效率。
对此,李斌表示:“AI时代的高性能计算,是一个算力、存力、网络高度紧耦合的系统。存算一体的核心,就是打破原有技术边界,实现有机协同。”
从趋势上看,国内存储行业需要主要有三个趋势:一是高性能化,随着科研场景的升级,存储系统的读写速度、容量上限将持续提升,以满足PB级、EB级数据的存储与处理需求;二是智能化,存储系统将引入AI技术,实现数据的智能管理、智能调度和智能优化,提升系统的运行效率和可靠性;三是国产化,随着国产替代的不断推进,高性能存储的核心部件、软件系统将逐步实现自主可控,构建完整的国产生态。
“千衍”下一步也契合这一方向。王乔介绍,丰富模拟的物理内容,并引入AI优化算法、挖掘数据将成为“千衍”未来的发展方向,“AI4S是未来科研的重要方向”。
如果说“千衍”是对存算极限的一次极端测试,那么AI产业对存力的渴求则是更广泛的压力测试。存储,正从算力竞赛的“后勤部门”升级为“战略前线”。
(文|Leo张ToB杂谈,作者|张申宇,编辑丨杨林)







快报
根据《网络安全法》实名制要求,请绑定手机号后发表评论