ArXiv: 2502.13138 - AIDE: AI-Driven Exploration

核心命题: 机器学习工程本质上是“代码空间中的搜索问题”。通过 AIDE,我们将试错过程转化为系统性的树搜索。

1. AIDE 架构核心

🔹 代码优化视角 (Code Optimization)

AIDE 不再把 MLE 视为简单的问答,而是定义为一个 代码优化 任务。它的目标是寻找能最大化目标指标(如 Accuracy/Loss)的代码序列。

🔹 树搜索 (Tree Search)

将 trial-and-error 过程形式化。通过战略性地重用(Reuse)和改进(Refine)有潜力的解决方案,在巨大的代码可能空间中进行高效导航。

🔹 计算量换性能 (Compute-Performance Trade-off)

通过投入更多的推理算力来进行更深、更广的树搜索,显著提升最终模型性能,实现 SOTA 水准。

2. 对 Weco-Hybrid 的实战意义

3. 战绩摘要

OpenAI MLE-Bench SOTA | METRs RE-Bench SOTA | Kaggle 级实战能力


返回论文列表 | 返回内核