ECSELは、物理法則に多く見られる「シグノミアル方程式」という数式形式を学習モデルに採用することで、高い予測精度と人間が直接読み解ける透明性を両立した新しい分類手法である。 従来の記号回帰手法が抱えていた膨大な計算コストという課題を、勾配ベースの最適化とL1正則化を組み合わせることで解決し、既存の最先端手法を上回る数式復元率と劇的な計算時間の短縮を達成した。 学習された数式からは、特徴量の変化が予測に与える影響を弾力性や反実仮想推論といった数学的指標で直接算出でき、不正検知や電子商取引などの実務において根拠に基づいた意思決定を強力に支援する。
ECSELは、物理法則に多く見られる「シグノミアル方程式」という数式形式を学習モデルに採用することで、高い予測精度と人間が直接読み解ける透明性を両立した新しい分類手法である。 従来の記号回帰手法が抱えていた膨大な計算コストという課題を、勾配ベースの最適化とL1正則化を組み合わせることで解決し、既存の最先端手法を上回る数式復元率と劇的な計算時間の短縮を達成した。 学習された数式からは、特徴量の変化が予測に与える影響を弾力性や反実仮想推論といった数学的指標で直接算出でき、不正検知や電子商取引などの実務において根拠に基づいた意思決定を強力に支援する。
現代の機械学習、特に深層学習を中心としたモデルは、複雑なデータセットに対して驚異的な予測精度を実現しているが、その内部プロセスは「ブラックボックス」化しており、なぜその予測に至ったのかという論理的な根拠を人間が理解することは極めて困難である。医療診断、金融融資、人事評価といった高い信頼性と説明責任が求められる高リスクなドメインにおいては、単に予測が当たるだけでなく、その意思決定プロセスが透明であり、人間が納得できる形で示されることが不可欠である。この課題に対し、入出力の関係を具体的な数学的公式として出力する「記号回帰(Symbolic Regression)」が注目されてきた。記号回帰によって生成されるモデルは、人間が直接読んで理解できる閉形式の数式であるため、本質的に高い説明性を持っている。 しかし、記号回帰は数式を構成する演算子や変数の膨大な組み合わせの中から最適なものを探索する必要があり、この探索問題は数学的にNP困難であることが知られている。従来の遺伝的プログラミングなどの手法は、計算リソースを大量に消費する上に、高次元のデータセットに対しては探索が収束しにくいという欠点があった。…
本研究が提案するECSEL(Explainable Classification via Signomial Equation Learning)は、シグノミアル方程式を学習の基礎に据えた、説明可能な分類手法である。シグノミアルとは、実数の係数と実数の指数を持つ「べき乗項」の有限個の和で定義される関数のことである。この形式は、科学的な物理方程式において頻繁に登場するべき乗則、逆相関、平方根などの関係性を自然かつ簡潔に表現できる非常に強力な構造である。ECSELの革新性は、モデルそのものが人間にとって解釈可能な閉形式の数式として構築される点にある。従来のモデルのように事後的に説明を生成するのではなく、学習された数式そのものが予測の根拠として機能する。 具体的には、多クラス分類タスクにおいて、各クラスに対して固有のシグノミアルスコア関数を割り当てる。…
続きはログイン/プランで閲覧できます。
続きを読む
無料プランで全文は月 2 本まで読めます。
Related