DC娱乐网

字跳刚发了个专门用来写 CUDA 内核的Agent:CUDA Agent, 以后

字跳刚发了个专门用来写 CUDA 内核的Agent:CUDA Agent, 以后AI是不是就能自我优化了论文:arxiv.org/abs/2602.24286

"GPU 内核优化是现代深度学习的基础,但它仍是一项高度专业化的工作,需要深厚的硬件专长。尽管大语言模型(LLM)在通用编程方面表现强劲,但在用于生成 CUDA 内核时,它们仍难以与基于编译器的系统(如 torch.compile)竞争。现有的 CUDA 代码生成方法要么依赖无需训练的迭代改写(refinement),要么在固定的多轮“执行—反馈”循环中对模型进行微调;然而这两种范式都无法从根本上提升模型内在的 CUDA 优化能力,因此带来的性能增益有限。

我们提出 CUDA Agent:一个大规模、面向智能体(agentic)的强化学习系统,通过三个组件来培养 CUDA 内核开发专长:(1)可扩展的数据合成流水线;(2)技能增强的 CUDA 开发环境,配备自动化验证与性能分析(profiling),以提供可靠的奖励信号;(3)支持稳定训练的强化学习算法技术。CUDA Agent 在 KernelBench 上取得了最先进(SOTA)的结果:在 KernelBench 的 Level-1、Level-2 和 Level-3 划分上,相比 torch.compile 的速度分别提升 100%、100% 和 92%;并且在最困难的 Level-3 设置上,比最强的闭源模型(如 Claude Opus 4.5 和 Gemini 3 Pro)大约高出 40%。"

HOW I AI