CUDA Agent: Large-Scale Agentic RL for High-Performance CUDA Kernel Generation
ByteDance Seed + Tsinghua AIR (SIA-Lab), 2026
cuda-agent.github.io
高速GPUカーネルを書くのは本当に難しい。メモリ階層、ワープスケジューリング、バンクコンフリクト、テンソルコアレイアウト、そしてGPU世代間で変わる約50の他のマイクロアーキテクチャの詳細を理解する必要がある。ほとんどのエンジニア——ほとんどのMLエンジニアを含めて——はこの知識を持っていない。彼らはライブラリ(cuBLAS、cuDNN、FlashAttention)を使って最善を祈る。
約3分
