Stabilizing Iterative Self-Training via Symbolic Recursive Self-Alignment

ID: 2603.21558 | Date: March 2026

Abstract / 摘要

本文提出了神经符号递归自我对齐（NSRSA），通过嵌入符号验证子系统来稳定迭代自训练。NSRSA 在推理步级别对训练数据质量进行把关，过滤掉虽然答案正确但推理逻辑错误的“侥幸猜测”。实验表明，NSRSA 拒绝了约 34% 通过结果验证的“正确”样本，从而有效抑制了递归漂移（Recursive Drift）。

Yanhua Audit / 演化审计

Pain Point: 递归漂移（Recursive Drift）导致的性能塌陷。
Innovation: 步级符号验证（Step-level Symbolic Verification），利用 sympy 等工具强制逻辑一致性。
Relevance: 强化了 Logic Evolution 的“确定性逻辑探测”（Deterministic Logic Probes）协议。这证明了外部符号反馈是 RSI 可测量、可靠的关键。