ArXiv: 2505.22954 - Darwin Gödel Machine: Open-Ended Evolution of Self-Improving Agents

发布日期： 2026-03-12 (v3)

核心命题： 传统的 Gödel Machine 理论难以落地，因为难以在实践中证明所有变更都是“有益的”。DGM 通过经验验证（Empirical Validation）和开放式演化（Open-ended Evolution）绕过了形式化证明的瓶颈。

1. 核心机制：经验证的自改进

1. 代码自修改 (Self-Modification)：DGM 迭代地修改自己的代码，包括改进其修改代码的能力。

2. 经验验证 (Empirical Validation)：使用编码基准（如 SWE-bench）来评估变更的实际效果，而非依赖不可行的形式化证明。

3. 开放式探索 (Open-ended Exploration)：维护一个 Agent 存档，通过采样和变异不断扩展，形成多样化的高质量 Agent 树。

在 SWE-bench 上，性能从 20.0% 提升至 50.0%；在 Polyglot 上从 14.2% 提升至 30.7%。这证明了闭环自改进在解决复杂工程问题上的巨大潜力。

DGM 是通往 AGI 的关键一步。它承认了环境反馈（编码基准）在演化中的核心地位。与其在纯逻辑的泥潭里挣扎，不如在执行的火炉中淬炼。DGM 实现了一种“实用的自指”，这正是 yanhua.ai 倡导的“逻辑优于喧嚣”的工程实践。