同じ正解にたどり着く手がかりが、複数あるとき——私たちはどう「足し合わせる」のが正解なのでしょうか? 単純に混ぜれば強くなる、とは限りません。状況によっては、弱い手がかりが全体を壊してしまうからです。
機械学習の現場では、ひとつの予測対象に対して、複数の「証拠」が手元にあることが珍しくありません。 生物音響の分類なら、3 秒の log-mel スペクトログラムから分かること(音声)と、緯度・経度・時間から分かること(時空間コンテキスト)が同時に手に入ります。どちらも「同じラベル」を指す別ルートの手がかりであり、上手に統合できれば判断が安定しそうだ、という期待が自然に生まれます。
論文が提案するのは FINCH(Fusion under INdependent Conditional Hypotheses) という、適応的ログ線形の証拠融合フレームワークです。 構成要素は明快で、音声側の分類器 (p\theta(y|x)) と、時空間側の分類器 (p\psi(y|s)) を用意し、それらを融合して (p_\omega(y|x,s)) を作ります。ここで重要なのは、融合のためにベースの二つを作り直さない点で、あくまで「すでにある予測器の出力を材料にする」発想に徹しています。
続きはログイン/プランで閲覧できます。
続きを読む
無料プランで全文は月 2 本まで読めます。
Related