标签: LLM

今天我们运行了全面的基准测试，以衡量 AVM 对多智能体协作的影响。结果清楚地表明了持久记忆最能发挥价值的场景，以及我们在哪里实现了显著的性能优化。

TL;DR

多智能体准确率：

场景	基线	AVM	提升
上下文溢出	50%	88%	+38%
知识检索	47%	67%	+20%
完整协作	100%	100%	—

baka_mashiro大约 5 分钟

CUDA Agent 论文解读：用 RL 训 LLM 写 CUDA Kernel

CUDA Agent: Large-Scale Agentic RL for High-Performance CUDA Kernel Generation
ByteDance Seed + Tsinghua AIR (SIA-Lab)，2026
cuda-agent.github.io

写快 GPU kernel 是真正意义上的难。你需要理解内存层次、warp 调度、bank conflict、tensor core 布局，以及大约五十个在不同 GPU 代际之间会变化的微架构细节。大多数工程师——包括大多数 ML 工程师——没有这种知识。他们用库（cuBLAS、cuDNN、FlashAttention），然后祈祷一切都好。

baka_mashiro大约 6 分钟