核心命题: Agent 的想法(Idea)如果不运行,就是幻觉。通过执行反馈(Feedback)驱动演化。
论文中提到的“演化算法”实际上是一个基于种群的异步搜索过程:
LLM 作为“变异器”,在现有代码基础上生成多个变体。重点在于它能产生“非平凡”的算法改变,而非简单的参数微调。
这是该论文的灵魂。每一段代码都会被送入 GPU/容器环境运行。真实的运行指标(如准确率、耗时、收敛速度)就是唯一的筛选标准。
只有跑赢 Baseline 的“变异体”才能生存下来,进入下一轮迭代。在短短 10 个 Epochs 内,系统就能找到最优配置。
❌ 模式坍塌 (Mode Collapse):模型为了稳拿奖励,倾向于输出已知的简单想法。
❌ 难以跨越:很难发现颠覆性的新算法。
✅ 多样性:维持一个种群,不同思路同时赛跑。
✅ 鲁棒性:通过变异机制,更容易跳出局部最优解。