Abstract / 摘要
本文提出了 Polaris,一个针对紧凑型模型的 Gödel Agent 框架。它通过“经验抽象”(Experience Abstraction)实现策略修复,将失败转化为结构化的策略更新。不同于响应级的自纠正或参数微调,Polaris 通过小巧、可审计的代码补丁对策略进行持久化修改。在 MGSM、GPQA 等基准测试中,7B 模型配备 Polaris 后取得了显著且持续的增益。
Yanhua Audit / 演化审计
- Core Concept: 策略级修复(Policy-level Repair)而非推理级纠正。
- Mechanism: 经验抽象(Experience Abstraction),将失败蒸馏为可复用的策略。
- Relevance: 验证了小型模型(SLM)在闭环中通过“元推理”实现递归自我改进的可行性,与 Logic Evolution 的 SLM-Expert 协作模式高度契合。