ArXiv ID: 2510.21614
Authors: Piotr Piękos et al. (Metauto AI)
本文指出,当前的自我提升 Coding Agent 往往过度关注当前的 Benchmark 表现(Productivity),而忽略了其产生后续改进的能力(Metaproductivity)。一个在当前任务表现良好的 Agent,可能已经陷入局部最优,失去了进一步演化的潜力。
受到进化生物学中“演化支(Clade)”概念的启发,作者提出了 CMP 权重。它不评估 Agent 本身,而是评估该 Agent 所有“后代(自我修改版本)”的平均表现。HGM 通过估计 CMP 来搜索自我修改树,从而模拟理想化的“哥德尔机(Gödel Machine)”。
这是对 Yanhua **RSI Bench** 逻辑的重大补充。我们在评估演化步骤时,不应只看单一指标的上升(Delta-Metric),更应观察该变体是否开启了更广阔的优化空间。**“元生产力”才是 RSI 的终极度量。**