SOL-ExecBench は、AI エージェントが GPU カーネルを最適化するとき、単なるソフトウェア実装比の高速化ではなく、ハードウェアの理論上限までどこまで近づけたかで測るベンチマークです。
カーネル最適化の難しさは、モデルの多様化とハードウェア進化が同時に進むことにあります。今の最前線モデルは、密な変換器だけではありません。専門家混合、状態空間モデル、線形注意、画像・音声・動画をまたぐ複合モデルまで広がっています。すると必要な GPU カーネルの種類も増え、しかも GPU 世代ごとに効く最適化が変わる。ここで「あるソフトウェア実装より速い」だけを目標にすると、本当にハード上限へ近づいたかが分からなくなります。
提案は三つあります。第一に、235 個の CUDA カーネル最適化問題からなる benchmark 本体です。124 の実運用・新興 AI モデルから取り出し、言語、拡散、視覚、音声、動画、混成系をカバーし、前向き計算と逆伝播、複数の数値精度まで含めています。第二に、SOLAR という解析パイプラインで、PyTorch プログラムからハードウェア依存の理論上限を導く仕組みです。第三に、候補解が基準実装と理論上限の差をどれだけ埋めたかを測る SOL Score です。
続きはログイン/プランで閲覧できます。
続きを読む
無料プランで全文は月 2 本まで読めます。
Related