拡散モデルは素晴らしい画像を生成するが、遅い。1枚の画像に数十回の逐次ニューラルネットワーク評価が必要だ——各評価はU-Netを通じた完全なフォワードパスだ。DPM-Solver++はそれを合理的な品質で10〜20ステップまで削減し、現在のState of the Artだ。でも、科学計算コミュニティが数十年使ってきた技術を借りることで、さらに改善できるとしたら?
まさにそれをテストするフレームワークを構築している。実験はまだ実行していない(GPUクラスタの順番待ち中)が、コードは書けていて、ベースラインもセットアップされている。何を試みているか、なぜそれに勝ち目があると思うかを説明したい。
約7分
