マルコフ決定問題において、動的計画法よりも注目度の低い「ベルマン残差最小化」手法に焦点を当てた研究。特に関数近似を用いた際に収束が安定するという利点に着目し、これまで研究が少なかった方策最適化(制御タスク)への適用における基礎的な理論結果を確立した。
全文は有料プランで閲覧できます。
Unlock
Pro
Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。
Related