継続更新

PolySHAP:交互作用を考慮した多項式回帰によるKernelSHAPの拡張

PolySHAPは、機械学習モデルの説明手法であるKernelSHAPを拡張し、特徴量間の複雑な交互作用を多項式回帰によってモデル化することで、シャプレイ値の推定精度を大幅に向上させる新しいアルゴリズムである。

PolySHAP:交互作用を考慮した多項式回帰によるKernelSHAPの拡張 の図解
論文図解

TL;DR(結論)

PolySHAPは、機械学習モデルの説明手法であるKernelSHAPを拡張し、特徴量間の複雑な交互作用を多項式回帰によってモデル化することで、シャプレイ値の推定精度を大幅に向上させる新しいアルゴリズムである。 この手法は、サンプル数が増加するに従って真のシャプレイ値へと収束する数学的な一致性が証明されており、実際のベンチマークデータセットを用いた検証においても、従来の線形近似手法やパーミュテーションサンプリングと比較して優れた推定性能を発揮することが示されている。 さらに、実務において推定精度を高める経験的な手法として知られていた「ペアサンプリング」が、実は2次の多項式を用いるPolySHAPと数学的に全く同一の出力を生成することを理論的に証明し、これまで不明であったペアサンプリングの有効性に対して強固な理論的根拠を与えている。

なぜこの問題か

機械学習モデルの予測結果に対して、各特徴量がどの程度貢献したかを公平に分配するための手法として、協力ゲーム理論に基づくシャプレイ値は説明可能なAI(XAI)の分野で極めて重要な役割を果たしている。 しかし、d個の特徴量を持つモデルにおいてシャプレイ値を厳密に計算するためには、2のd乗という膨大な数のモデル評価が必要となり、特徴量の数が増えるにつれて計算コストが指数関数的に増大するという深刻な計算困難性が大きな障壁となっていた。 この課題を解決するために、LundbergとLeeによって提案されたKernelSHAPは、ゲームを線形関数として近似し、ランダムに選択された特徴量の部分集合を用いた少数の評価からシャプレイ値を推定する代表的な手法として広く普及してきた。 しかし、従来のKernelSHAPには本質的な限界が存在する。KernelSHAPは加法的な線形近似に基づいているため、特徴量間に存在する複雑な非線形の交互作用を十分に捉えることができず、近似精度が頭打ちになるという問題が指摘されていた。…

核心:何を提案したのか

本研究の核心的な提案は、従来のKernelSHAPの枠組みを多項式回帰へと拡張した新しいアルゴリズム「PolySHAP」である。 PolySHAPは、ゲームの値を単なる線形関数ではなく、高次の多項式で近似することによって、特徴量同士の組み合わせが予測に与える相乗効果や相殺効果をより正確にモデル化する。 具体的には、任意の交互作用の集合を含む「交互作用フロンティア」という概念を定義し、最小二乗法の枠組みの中でこれらの項の係数を推定する。 これにより、モデルの振る舞いをより詳細に記述する多項式表現を獲得し、そこからシャプレイ値を抽出することが可能となった。 この提案の重要な側面は、PolySHAPが数学的な一致性を備えている点である。…

続きはログイン/プランで閲覧できます。

続きを読む

ログインで全文を月 2 本まで無料で読めます

ログインして続きを読む

無料プランで全文は月 2 本まで読めます。

Related

次に読む