本研究は、タスク解決に必要なディープラーニングの最小アーキテクチャを特定するための計算手法を提案する。DNN、CNN、ViTを用いた画像分類において、アーキテクチャ探索、収束性、枝刈り感度、量子化耐性を体系的に分析した。その結果、性能の普遍性や学習ダイナミクスの3つのレジーム、安定学習に必要な最小パラメータ数などを明らかにした。
全文は有料プランで閲覧できます。
Unlock
Pro
Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。
Related