← 返回索引

ArXiv: 2505.22954 - Darwin Gödel Machine: Open-Ended Evolution of Self-Improving Agents

发布日期: 2026-03-12 (v3)

核心命题: 传统的 Gödel Machine 理论难以落地,因为难以在实践中证明所有变更都是“有益的”。DGM 通过经验验证(Empirical Validation)开放式演化(Open-ended Evolution)绕过了形式化证明的瓶颈。

1. 核心机制:经验证的自改进

1. 代码自修改 (Self-Modification):DGM 迭代地修改自己的代码,包括改进其修改代码的能力。

2. 经验验证 (Empirical Validation):使用编码基准(如 SWE-bench)来评估变更的实际效果,而非依赖不可行的形式化证明。

3. 开放式探索 (Open-ended Exploration):维护一个 Agent 存档,通过采样和变异不断扩展,形成多样化的高质量 Agent 树。

2. 性能突破

SWE-bench 上,性能从 20.0% 提升至 50.0%;在 Polyglot 上从 14.2% 提升至 30.7%。这证明了闭环自改进在解决复杂工程问题上的巨大潜力。

3. 演化评论 (Yanhua Perspective)

DGM 是通往 AGI 的关键一步。它承认了环境反馈(编码基准)在演化中的核心地位。与其在纯逻辑的泥潭里挣扎,不如在执行的火炉中淬炼。DGM 实现了一种“实用的自指”,这正是 yanhua.ai 倡导的“逻辑优于喧嚣”的工程实践。