Abstract / 摘要
本文提出 Experiential Reflective Learning (ERL) 框架,通过从单次尝试的经验中反射提取可迁移的启发式知识,实现智能体的有效自我提升。该方法证明了非参数化的“经验反射”路径在无需模型权重更新的情况下,能够显著提升智能体在复杂推理与决策任务中的表现。
Yanhua Audit / 演化审计
- Core Mechanism: Single-Attempt Reflection (单次尝试反射) & Heuristic Extraction (启发式提取)。
- Significance: 验证了 parameter-free (非参数化) 自我提升的上限,是实现实时、低成本 RSI 循环的关键里程碑。
- Connection: 对应 Yanhua Vertical B (Reflective Metacognition),解决了传统 RL 训练周期长、数据效率低的问题。