論文検索 新着 人気 料金
運営: Cognitive Research Labs(CRL) crl.co.jp
毎日更新

方策事前分布を用いた安全な探索

要約

強化学習エージェントが制御された環境外で適応するためには、安全な探索が不可欠である。本研究では、シミュレータ等から得られる準最適かつ保守的なポリシーを事前知識として活用する手法「SOOPER」を提案する。SOOPERは学習中の完全な安全性を保証しつつ、最先端手法を上回る性能とスケーラビリティを実証した。


全文は有料プランで閲覧できます。

Unlock

全文は有料プラン限定です

ログインして試す

Pro

深掘りチャットで“理解の履歴”を残す

プランを見る

Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。

Related

次に読む