AI研究 2026-01-29 タグ: cs.RO, cs.AI, cs.HC

HARMONI：LLMを用いた多人数対ロボット相互作用のマルチモーダルなパーソナライズ

HARMONIは、介護施設のような多人数が同時に存在する複雑な環境において、大規模言語モデル（LLM）の能力を最大限に引き出し、個々のユーザーに対する長期的なパーソナライズを実現するための革新的なマルチモーダル・フレームワークである。

論文図解

TL;DR（結論）

HARMONIは、介護施設のような多人数が同時に存在する複雑な環境において、大規模言語モデル（LLM）の能力を最大限に引き出し、個々のユーザーに対する長期的なパーソナライズを実現するための革新的なマルチモーダル・フレームワークである。このシステムは、知覚、世界モデリング、ユーザーモデリング、生成という4つの独立したモジュールを統合することで、動的な話者交代や予期せぬ割り込みに対してもリアルタイムで文脈を維持し、短期および長期のメモリを効果的に管理しながら、プライバシーと倫理に配慮した応答を生成する。実際の介護施設での実証実験や複数の標準データセットを用いた厳密な検証を通じて、従来の手法よりもユーザー識別の正確性や対話の質、そして利用者の満足度が大幅に向上することが確認されており、社会支援ロボットの実社会展開における重要な技術的基盤を提供している。

なぜこの問題か

社会支援ロボット（SAR）は、高齢者や障害を持つ人々の身体的、認知的、社会的なニーズをサポートする手段として、近年非常に大きな注目を集めている。しかし、これまでの研究の多くは、ロボットと人間が一対一で対話する単純な状況に焦点を当てており、介護施設やリハビリテーションセンターのような、複数のユーザーが同時に存在し、相互に影響し合う複雑な実環境での運用には多くの課題が残されていた。多人数環境では、会話の途中で別の人が割り込んできたり、複数の話題が並行して進行したりすることが日常的に発生するため、ロボットは「今誰が話しているのか」を正確に認識するだけでなく、それぞれのユーザーが過去にどのような発言をしたか、どのような好みを持っているかという個別の背景を長期的に記憶し、それに基づいて振る舞いを調整する必要がある。既存のシステムでは、このような複数のセッションにわたる継続的なパーソナライズや、動的な環境変化への適応メカニズムが不足しており、その結果としてユーザーの関心が急速に低下したり、ロボットに対する信頼関係が十分に構築されなかったりするという問題が生じていた。…

核心：何を提案したのか

本研究で提案された「HARMONI」は、多人数環境におけるロボット対話の質を根本から高めるためのマルチモーダルなパーソナライズ・フレームワークである。このフレームワークの核心は、個々のユーザーの特性とグループ全体の動的なニーズを同時に考慮しながら、倫理的および社会的な制約を厳格に遵守した対話を実現する点にある。具体的には、多様なユーザーの好みや行動パターンに適応するためのマルチモーダル戦略、対話を通じてユーザー情報を逐次更新するオンライン・ユーザーモデリング、そしてセッションをまたいだ長期記憶と現在の対話の文脈を保持する短期記憶を統合的に管理するリアルタイム・メモリシステムという、複数の革新的な要素を組み合わせている。…

続きはログイン/プランで閲覧できます。

ログインで全文を月 2 本まで無料で読めます

ログインして続きを読む

無料プランで全文は月 2 本まで読めます。