学習済みの人工ニューラルネットワーク(ANN)をスパイキングニューラルネットワーク(SNN)に変換する手法は、強化学習において有望だが、連続制御タスクでは性能が低い。本研究はこの原因が、小さな行動近似誤差が時間的に相関し、累積的な状態分布のシフトを引き起こす「誤差増幅」にあると特定した。
全文は有料プランで閲覧できます。
Unlock
Pro
Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。
Related