高い疎性では勾配が荒れやすく、スパース学習は収束も汎化も不安定になりがちです。ZO-SAM は SAM の摂動生成だけをゼロ次最適化に置き換え、平坦な解を探す利点を残しながら計算負荷を抑えることで、精度・収束・頑健性の三つを同時に改善しようとします。
ディープラーニングの大規模化は続いていますが、学習コストとメモリ要件の問題は依然として重いままです。とくにエッジ環境や省計算環境では、フルサイズモデルを前提にしたままでは展開できません。スパースニューラルネットワークは、この制約を和らげる有力な方向です。使う重みを減らすことで、パラメータ数も演算量も落とせます。
ZO-SAM の中心発想は、SAM の価値と SAM の重さを切り分けることです。欲しいのは、平坦な解を探すことで学習を安定させる SAM の効果です。不要なのは、そのために常にフル精度の二回目逆伝播を払うことです。そこで著者らは、SAM の摂動生成だけをゼロ次最適化で近似し、更新そのものは通常の一次勾配で行う構成を提案しました。
続きはログイン/プランで閲覧できます。
続きを読む
無料プランで全文は月 2 本まで読めます。
Related