グラフ異常検知における「ラベル不足」と「極端なクラス不均衡」という二大課題を解決するため、能動学習と反事実的推論を統合した新フレームワーク「AC2L-GAD」が提案されました。 従来の対照学習が抱えていた、ランダムなデータ拡張による意味的一貫性の喪失(Gap G1)と、単純な負例サンプリングによる識別能力の停滞(Gap G2)という根本的な欠陥を、情報理論に基づく戦略的なノード選択と、異常の性質を精密に制御する反事実的なデータ生成によって克服しています。 9つのベンチマークを用いた実験では、18の主要な既存手法を上回る検知精度を達成しながら、計算コストを約65%削減することに成功しており、大規模ネットワークにおける実用性と高精度な識別能力を極めて高いレベルで両立させています。
グラフ異常検知における「ラベル不足」と「極端なクラス不均衡」という二大課題を解決するため、能動学習と反事実的推論を統合した新フレームワーク「AC2L-GAD」が提案されました。 従来の対照学習が抱えていた、ランダムなデータ拡張による意味的一貫性の喪失(Gap G1)と、単純な負例サンプリングによる識別能力の停滞(Gap G2)という根本的な欠陥を、情報理論に基づく戦略的なノード選択と、異常の性質を精密に制御する反事実的なデータ生成によって克服しています。 9つのベンチマークを用いた実験では、18の主要な既存手法を上回る検知精度を達成しながら、計算コストを約65%削減することに成功しており、大規模ネットワークにおける実用性と高精度な識別能力を極めて高いレベルで両立させています。
グラフ異常検知(GAD)は、現代社会の安全と信頼を支える基盤技術として、金融取引における不正防止、サイバーセキュリティでの侵入検知、さらには複雑な生物学的ネットワークの解析など、多岐にわたる重要な領域で活用されています。しかし、この技術を実社会に適用する際には、解決が極めて困難な二つの大きな壁が立ちはだかります。第一に「ラベル付きデータの圧倒的な不足」です。異常データのラベルを正確に収集するには、各分野の専門家による膨大な精査と時間が必要であり、信頼できる教師データを得るためのコストは非現実的なほど高騰しています。第二に「極端なクラス不均衡」の問題です。正常なデータに対して異常データは統計的に極めて稀であり、この不均衡が原因で、誤検知や見逃しがもたらす社会的・経済的損失が非対称に大きくなるという課題があります。 これらの制約を克服する手段として、ラベルのない膨大なデータを有効活用できる「グラフ対照学習(GCL)」が大きな注目を集めてきました。対照学習は、同じノードから生成された異なるビュー(正例)を近づけ、異なるノード(負例)を遠ざけることで、高度な識別能力を持つ表現を学習する手法です。…
本論文が提案する「AC2L-GAD(Active Counterfactual Contrastive Learning for Graph Anomaly Detection)」は、能動学習(Active Learning)の戦略性と反事実的推論(Counterfactual Reasoning)の論理性を世界で初めて統合した、グラフ異常検知のための革新的な統一フレームワークです。この手法の核心的なアイデアは、グラフ全体に対して一律かつ盲目的に処理を施すのではなく、学習プロセスにおいて最も価値が高い「情報量の多いノード」を戦略的に選別し、それらに対して「もしこの特徴がこう変わっていたら」という反事実的な変化を加えることで、極めて高品質な学習データを能動的に生成する点にあります。…
続きはログイン/プランで閲覧できます。
続きを読む
無料プランで全文は月 2 本まで読めます。
Related