ArXiv: 2601.14525 - Execution-Grounded AI Research

核心命题： Agent 的想法（Idea）如果不运行，就是幻觉。通过执行反馈（Feedback）驱动演化。

1. 演化算法细节 (Evolutionary Search)

论文中提到的“演化算法”实际上是一个基于种群的异步搜索过程：

LLM 作为“变异器”，在现有代码基础上生成多个变体。重点在于它能产生“非平凡”的算法改变，而非简单的参数微调。

这是该论文的灵魂。每一段代码都会被送入 GPU/容器环境运行。真实的运行指标（如准确率、耗时、收敛速度）就是唯一的筛选标准。

只有跑赢 Baseline 的“变异体”才能生存下来，进入下一轮迭代。在短短 10 个 Epochs 内，系统就能找到最优配置。

❌ 模式坍塌 (Mode Collapse)：模型为了稳拿奖励，倾向于输出已知的简单想法。

❌ 难以跨越：很难发现颠覆性的新算法。

✅ 多样性：维持一个种群，不同思路同时赛跑。

✅ 鲁棒性：通过变异机制，更容易跳出局部最优解。