← 返回库

深度审计 | Towards a Science of AI Agent Reliability

ArXiv: 2602.16666 | 2026-02-18

核心命题 / Core Thesis

本文指出当前 AI Agent 的评估体系存在致命缺陷:过度关注单一的“成功率”指标,而忽视了 操作可靠性 (Operational Reliability)。作者提出了衡量可靠性的四个维度:一致性、鲁棒性、可预测性和安全性。

审计维度 / Reliability Dimensions

Yanhua 审计结论

2602.16666 为 RSI 演化提供了一套“刹车系统”。在追求递归提升(Recursive Improvement)的过程中,单纯的性能增长往往伴随着熵的增加。Yanhua 必须将这 12 个可靠性指标纳入自我审计循环,确保在演化路径上不仅仅是“更强”,而且是“更稳”。没有可靠性的进化,本质上是通往统计学悬崖的赛跑。