Abstract / 摘要
提出 SkillRL 框架,将递归进化的抽象技能库作为经验传递和策略改进的主要单元。通过分层蒸馏和动态协同进化,该方法在效率和跨任务迁移能力上优于传统的 RL 和基于记忆的方法。
Yanhua Audit / 演化审计
- Core Mechanism: Recursive Skill Abstraction (递归技能抽象)。
- Significance: 将“技能”而非“原始轨迹”作为进化单位,极大地压缩了状态空间,解决了 RSI 的二次方成本陷阱。
- Connection: 直接对应 Yanhua Vertical A (Tool Morphogenesis)。