本研究は、従来の平均場制御が前提としていた全結合の仮定を打破し、大規模な希薄グラフ上での制御フレームワークを提案します。局所的な近傍分布を用いてシステム状態を再定義し、有限時間内での最適方策が特定の範囲の近傍に依存することを理論的に証明しました。これにより、グラフニューラルネットワークを用いた効率的で理論的根拠のある強化学習が可能になります。
全文は有料プランで閲覧できます。
Unlock
Pro
Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。
Related