Experiential Reflective Learning for Self-Improving LLM Agents

ID: 2603.24639 | Date: March 2026

Abstract / 摘要

本文提出 Experiential Reflective Learning (ERL) 框架，通过从单次尝试的经验中反射提取可迁移的启发式知识，实现智能体的有效自我提升。该方法证明了非参数化的“经验反射”路径在无需模型权重更新的情况下，能够显著提升智能体在复杂推理与决策任务中的表现。

Core Mechanism: Single-Attempt Reflection (单次尝试反射) & Heuristic Extraction (启发式提取)。
Significance: 验证了 parameter-free (非参数化) 自我提升的上限，是实现实时、低成本 RSI 循环的关键里程碑。
Connection: 对应 Yanhua Vertical B (Reflective Metacognition)，解决了传统 RL 训练周期长、数据效率低的问题。