継続更新

ローカルに考え、グローバルに説明する:局所推論と信念伝播によるグラフ誘導型LLM調査

大規模で複雑なITインシデント管理において、従来のLLMエージェントはコンテキスト制限や推論の非決定性により、一度の成功はあっても継続的な信頼性に欠けるという課題を抱えていた。 本研究が提案するEoG(Explanations over Graphs)は、決定論的なコントローラーによる探索管理と、LLMによる局所的なアブダクション推論を分離し、メッセージパッシングを用いたセマンティック信念伝播(SBP)によって動的な判断修正を可能にした。 ITBenchを用いた検証では、従来のReAct手法と比較して、複数回の実行における一貫した正解率を示すMajority@k F1スコアで平均7倍の向上を達成し、複雑な依存関係を持つシステムにおける根本原因特定において極めて高い信頼性を実証した。

ローカルに考え、グローバルに説明する:局所推論と信念伝播によるグラフ誘導型LLM調査 の図解
論文図解

TL;DR(結論)

大規模で複雑なITインシデント管理において、従来のLLMエージェントはコンテキスト制限や推論の非決定性により、一度の成功はあっても継続的な信頼性に欠けるという課題を抱えていた。 本研究が提案するEoG(Explanations over Graphs)は、決定論的なコントローラーによる探索管理と、LLMによる局所的なアブダクション推論を分離し、メッセージパッシングを用いたセマンティック信念伝播(SBP)によって動的な判断修正を可能にした。 ITBenchを用いた検証では、従来のReAct手法と比較して、複数回の実行における一貫した正解率を示すMajority@k F1スコアで平均7倍の向上を達成し、複雑な依存関係を持つシステムにおける根本原因特定において極めて高い信頼性を実証した。

なぜこの問題か

現代のクラウドインフラやマイクロサービス環境は、膨大な量のログ、メトリクス、トレース、イベントを絶え間なく生成しており、障害発生時の診断は極めて困難なタスクとなっている。これらの環境は静的ではなく、エンティティ間の相互作用や信号の共分散といった隠れた依存関係が複雑に絡み合っている。ある事実が重要であるかどうかは、他の証拠が発見されて初めて明らかになることが多く、診断プロセスは本質的に非単調な性質を持っている。しかし、既存のLLMエージェント、特にReActやCodeActといった手法には、この複雑さに対処するための構造的な欠陥が存在する。 第一に、コンテキストウィンドウの制限という物理的な制約がある。膨大な観測データから必要な情報をすべて一度にLLMに提示することは不可能であり、エージェントは中間結果を要約せざるを得ない。この要約の過程で、その時点では重要性が不明な証拠が破棄されてしまい、後の推論で必要となる決定的な情報が失われるリスクが常につきまとう。第二に、推論の非決定性と信頼性のギャップが深刻である。…

核心:何を提案したのか

本研究は、調査プロセスを依存関係グラフ上でのアブダクション(仮説的推論)として定式化し、EoG(Explanations over Graphs)と呼ばれる新しいエージェントアーキテクチャを提案している。EoGの根本的な設計思想は「意思決定と制御の分離」にある。これは、複雑な推論を必要とする部分と、厳密な管理が必要な部分を明確に分けることで、システム全体の堅牢性と透明性を高めるアプローチである。 具体的には、システム全体をエンティティ(サービス、ポッド、設定など)をノードとし、それらの間の依存関係をエッジとする「運用グラフ」として表現する。診断の目的は、観測された異常(アラートやエラー)を説明できる最小の部分グラフ、すなわち「説明的フロンティア」を特定することに変換される。…

続きはログイン/プランで閲覧できます。

続きを読む

ログインで全文を月 2 本まで無料で読めます

ログインして続きを読む

無料プランで全文は月 2 本まで読めます。

Related

次に読む