持续学习是一个投入大量资源的研究领域,不过在如何衡量其进展上,目前的成果还相当有限。其中最核心的问题是:专门设计的记忆系统,真的能帮助智能体从经验中学习吗?持续学习基准(CL-Bench)给出的答案是否定的。
在六个经过专家验证、且具有共享可学习结构的领域测试中,朴素的上下文学习(ICL)效果反而比那些专为记忆管理设计的系统更好。CL-Bench还引入了一个增益指标,用来区分智能体的真正学习能力和原有基础能力——结果发现,智能体往往要么过度拟合眼前的观察数据,要么无法在不同实例之间复用已学知识。
如果你的记忆架构连朴素ICL基准都打不过,那说明这个架构只是徒增系统开销,并没有真正促进学习。相关论文于2026年6月发布,链接是:arxiv.org/abs/2606.05661;想要学习如何构建有效的AI智能体,可以访问:academy.dair.ai。






快报