AI研究 2026-02-01 タグ: cs.LG

影響の矛盾を用いた頑健なGNNのためのラベルノイズの特定と修正

グラフニューラルネットワーク（GNN）は社会分析や生物情報学などの多様な分野で活用されているが、現実のデータには注釈ミスや不整合に起因するラベルノイズが含まれることが多く、これがモデルの堅牢性と汎用性を著しく低下させるという課題がある。

論文図解

TL;DR（結論）

グラフニューラルネットワーク（GNN）は社会分析や生物情報学などの多様な分野で活用されているが、現実のデータには注釈ミスや不整合に起因するラベルノイズが含まれることが多く、これがモデルの堅牢性と汎用性を著しく低下させるという課題がある。本研究ではグラフ構造と属性情報の両方を活用してノイズを特定・修正する新しい手法「ICGNN」を提案し、グラフ拡散行列に基づく影響矛盾スコア（ICS）とガウス混合モデル（GMM）を組み合わせることで、ノイズの正確な検出と近傍ノードの予測を用いた柔軟なラベル修正を実現した。 6つのベンチマークデータセットを用いた実験の結果、提案手法は一様ノイズおよびペアノイズの双方において既存の最先端手法を上回る性能を示し、ラベルが限られた状況下でも高い精度を維持できることが実証され、実世界におけるGNNの応用可能性を大きく広げる成果となった。

なぜこの問題か

グラフ構造を持つデータから学習を行うグラフニューラルネットワーク（GNN）は、近年、ソーシャルネットワーク解析、生物学、推薦システム、知識グラフなど、多岐にわたるドメインで重要な役割を果たしている。GNNの基本的な考え方は、隣接するノードから伝播される情報を反復的に集約することでノードの表現を更新し、複雑な関係性やパターンを効果的に探索することにある。しかし、既存の多くのGNNモデルは、与えられたクラスラベルが清潔で正確であるという仮定に依存している。現実世界のデータにおいては、人間の主観的な解釈やデータ収集時の不整合、あるいは単純な注釈ミスによって、ラベルにノイズが含まれることが避けられない。例えば、推薦システムにおけるユーザーとアイテムの相互作用グラフでは、ユーザーの誤ったフィードバックや、実際の好みと行動の不一致からノイズの多いラベルが生じることがある。同様に、分子グラフにおいても化学的な注釈エラーが化合物の誤分類を招く可能性がある。このようなラベルノイズはGNNの堅牢性を損ない、未知のデータに対する汎化性能を著しく低下させる要因となる。…

核心：何を提案したのか

本論文では、グラフ構造に内在する複雑な相互作用に基づき、異なるクラスのノード間における「影響の矛盾」を定量化することでラベルノイズに対処する、新しいグラフニューラルネットワーク「ICGNN」を提案している。この手法の核心は、グラフ内のメッセージパッシングプロセスにおいて、あるノードが自分とは異なるクラスのノードから受ける影響が強い場合、そのノードのラベルはノイズである可能性が高いという仮説に基づいている。この仮説を具体化するために、著者らは「影響矛盾スコア（Influence Contradiction Score, ICS）」という新しい指標を設計した。 ICGNNは主に3つのコンポーネントで構成されている。…

続きはログイン/プランで閲覧できます。

ログインで全文を月 2 本まで無料で読めます

ログインして続きを読む

無料プランで全文は月 2 本まで読めます。