継続更新

Memora: 抽象化と具体性のバランスを両立する調和型メモリ表現

MEMORAは、自律エージェントが膨大な情報を蓄積しながら効率的かつ文脈に応じた検索を行うために開発された、抽象化と具体性のバランスを構造的に両立させる「調和型メモリ表現」である。情報の核となる「主要な抽象化」が具体的な「メモリ値」をインデックス化し、関連する更新を統合することで情報の断片化を防ぎつつ、多角的なアクセス経路となる「キュー・アンカー」によってメモリ間の広範な接続性を実現する。検索を能動的な推論プロセスとして扱うポリシー駆動型メカニズムを導入した結果、従来のRAGや知識グラフを上回る精度を達成し、フルコンテキスト処理と比較してトークン消費量を最大98%削減することに成功した。LoCoMoやLongMemEvalといったベンチマークで最高水準の性能を記録し、長期的な推論能力を大幅に向上させている。

Memora: 抽象化と具体性のバランスを両立する調和型メモリ表現 の図解
論文図解

TL;DR(結論)

MEMORAは、自律エージェントが膨大な情報を蓄積しながら効率的かつ文脈に応じた検索を行うために開発された、抽象化と具体性のバランスを構造的に両立させる「調和型メモリ表現」である。情報の核となる「主要な抽象化」が具体的な「メモリ値」をインデックス化し、関連する更新を統合することで情報の断片化を防ぎつつ、多角的なアクセス経路となる「キュー・アンカー」によってメモリ間の広範な接続性を実現する。検索を能動的な推論プロセスとして扱うポリシー駆動型メカニズムを導入した結果、従来のRAGや知識グラフを上回る精度を達成し、フルコンテキスト処理と比較してトークン消費量を最大98%削減することに成功した。LoCoMoやLongMemEvalといったベンチマークで最高水準の性能を記録し、長期的な推論能力を大幅に向上させている。

なぜこの問題か

現在の自律エージェントは、計画立案やツール利用、多段階の推論において大きな進歩を遂げているが、本質的には「ステートレス(状態を持たない)」な存在に留まっている。これは、過去の経験を組織化し、抽象化して再利用するための原則的なメカニズムが欠如しているためであり、エージェントは繰り返されるタスクやユーザーの意図を孤立したイベントとして処理せざるを得ない。その結果、エージェントは同じような推論ステップを何度も繰り返すことになり、パフォーマンスの不安定化やトークンコストの増大を招いている。メモリのスケーリングにおける最大の課題は、情報の「抽象化」と「具体性」の間にある根本的な緊張関係を解消することにある。 既存の設計は、生の対話ログや文書の断片をそのまま保存する「具体性重視」のアプローチか、あるいは高レベルの要約に圧縮する「抽象化重視」のアプローチのいずれかに極端に偏る傾向がある。具体性を重視しすぎると、構造化されていないノイズによってエージェントが圧倒され、孤立した事実の断片からは長期的なタスクに必要な文脈や依存関係を捉えることができなくなる。…

核心:何を提案したのか

MEMORAは、抽象化と具体性の調和を図ることで、大規模なメモリ環境においても高い推論能力を維持できる新しいアーキテクチャを提案している。このシステムの核心は、具体的なコンテンツの上にナビゲーション用の足場として機能する「二層構造の表現」を採用している点にある。メモリのエントリは、そのメモリが根本的に何についてのものであるかを定義する「主要な抽象化(Primary Abstraction)」と、具体的な情報を格納する「メモリ値(Memory Value)」のペアで構成される。主要な抽象化は、メモリの「正統なアイデンティティ」として機能し、新しい概念を新しいエントリとして取り込む一方で、関連する更新を既存のレコードに統合する役割を果たす。…

続きはログイン/プランで閲覧できます。

続きを読む

ログインで全文を月 2 本まで無料で読めます

ログインして続きを読む

無料プランで全文は月 2 本まで読めます。

Related

次に読む