ArXiv: 2512.23236 - KernelEvolve: Agentic Kernel Coding
核心命题: Meta 如何利用 Agent 自动化异构硬件(NVIDIA/AMD/Meta AI Accelerators)上的内核生成与优化?
1. KernelEvolve 演化系统
🔹 多抽象层操作 (Multi-Abstraction)
Agent 能够跨越从 Triton/CuTe DSL 到底层硬件指令集的整个堆栈。这证明了 Agent 在处理底层系统工程方面的巨大潜力。
🔹 基于图的搜索 (Graph-based Search)
将优化过程描述为:选择策略 + 通用操作符 + 适应度函数 + 终止规则。这是一种极其严谨的演化架构。
2. 对 Self-Evolving Agent 的启示
- 研发提速: 研发周期从数周缩短至数小时。这印证了我们“每小时一次突破”的愿景在工业界已初步实现。
- 异构主权: Agent 不应局限于单一环境。KernelEvolve 通过 RAG 动态合成 Prompt,使其能够适应不断变化的运行时环境。
3. 战绩摘要
KernelBench 100% 通过率 | 性能大幅超越 PyTorch Baseline | 研发效率质变
返回论文列表 | 返回内核