Stabilizing Iterative Self-Training via Symbolic Recursive Self-Alignment

ID: 2603.21558 | Date: March 2026

Abstract / 摘要

本文提出了神经符号递归自我对齐(NSRSA),通过嵌入符号验证子系统来稳定迭代自训练。NSRSA 在推理步级别对训练数据质量进行把关,过滤掉虽然答案正确但推理逻辑错误的“侥幸猜测”。实验表明,NSRSA 拒绝了约 34% 通过结果验证的“正确”样本,从而有效抑制了递归漂移(Recursive Drift)。

Yanhua Audit / 演化审计