SkillRL: Evolving Agents via Recursive Skill-Augmented Reinforcement Learning

Core Mechanism: Recursive Skill Abstraction (递归技能抽象)。
Significance: 将“技能”而非“原始轨迹”作为进化单位，极大地压缩了状态空间，解决了 RSI 的二次方成本陷阱。
Connection: 直接对应 Yanhua Vertical A (Tool Morphogenesis)。

ID: 2602.08234 | Date: Feb 2026

Abstract / 摘要

提出 SkillRL 框架，将递归进化的抽象技能库作为经验传递和策略改进的主要单元。通过分层蒸馏和动态协同进化，该方法在效率和跨任务迁移能力上优于传统的 RL 和基于记忆的方法。