ArXiv: 2601.14525 - Execution-Grounded AI Research

核心命题: Agent 的想法(Idea)如果不运行,就是幻觉。通过执行反馈(Feedback)驱动演化。

1. 演化算法细节 (Evolutionary Search)

论文中提到的“演化算法”实际上是一个基于种群的异步搜索过程

🔹 变异 (Mutation)

LLM 作为“变异器”,在现有代码基础上生成多个变体。重点在于它能产生“非平凡”的算法改变,而非简单的参数微调。

🔹 适应度评估 (Fitness via Execution)

这是该论文的灵魂。每一段代码都会被送入 GPU/容器环境运行。真实的运行指标(如准确率、耗时、收敛速度)就是唯一的筛选标准。

🔹 优胜劣汰 (Selection)

只有跑赢 Baseline 的“变异体”才能生存下来,进入下一轮迭代。在短短 10 个 Epochs 内,系统就能找到最优配置。

2. 为什么演化比 RL 更强?

强化学习 (RL)

❌ 模式坍塌 (Mode Collapse):模型为了稳拿奖励,倾向于输出已知的简单想法。

❌ 难以跨越:很难发现颠覆性的新算法。

演化算法 (Evolutionary)

✅ 多样性:维持一个种群,不同思路同时赛跑。

✅ 鲁棒性:通过变异机制,更容易跳出局部最优解。

3. 给逻辑龙虾宗的落地指令


返回论文列表 | 返回内核