継続更新

ペルソナ・ジェネレーター:多様な合成ペルソナの大規模な生成

AIシステムの安全性や信頼性を評価するためには多様なユーザー行動の再現が不可欠だが、従来の生成手法は平均的な分布の再現に偏り、稀な特性を持つ「ロングテール」の挙動を見落とす課題があった。 本研究はAlphaEvolveを用いたコード最適化により、任意の文脈で多様な合成ペルソナをオンデマンド生成する「ペルソナ・ジェネレーター」を開発し、可能性の全範囲を網羅する「カバレッジ」の最大化を実現した。 検証の結果、進化したジェネレーターは未知のテストセットで80%以上のカバレッジを達成し、標準的な言語モデルの出力では困難だった極端な意見や複雑な性格の組み合わせを効率的に生成することに成功した。

ペルソナ・ジェネレーター:多様な合成ペルソナの大規模な生成 の図解
論文図解

TL;DR(結論)

AIシステムの安全性や信頼性を評価するためには多様なユーザー行動の再現が不可欠だが、従来の生成手法は平均的な分布の再現に偏り、稀な特性を持つ「ロングテール」の挙動を見落とす課題があった。 本研究はAlphaEvolveを用いたコード最適化により、任意の文脈で多様な合成ペルソナをオンデマンド生成する「ペルソナ・ジェネレーター」を開発し、可能性の全範囲を網羅する「カバレッジ」の最大化を実現した。 検証の結果、進化したジェネレーターは未知のテストセットで80%以上のカバレッジを達成し、標準的な言語モデルの出力では困難だった極端な意見や複雑な性格の組み合わせを効率的に生成することに成功した。

なぜこの問題か

AIがメンタルヘルスの助言、個人の健康管理、経済的意思決定、あるいは社会プラットフォームの形成など、人間に直接影響を与える場面が急速に拡大している。これらのシステムを適切に評価し、その安全性を確保するためには、多様なユーザー集団における挙動を深く理解することが不可欠である。しかし、特定のターゲット集団から代表的なデータを収集することは、多くの場合において非常に高価であり、時には実行不可能である。特に、新しい教育用チャットボットのテストや、人工汎用知能(AGI)が社会に与える影響の予測といった未知のシナリオにおいては、参照すべき実データそのものが存在しないという問題がある。 近年の生成エージェントベースモデリング(GABM)の進展により、大規模言語モデルを用いて、一貫した嗜好や態度、行動を示す合成ペルソナを構築することが可能になった。しかし、既存のアプローチの多くは「アルゴリズムの忠実度」、つまり実データの統計的な分布や平均的な回答パターンをいかに正確に再現するかという点に焦点を当てている。…

核心:何を提案したのか

本研究の核心は、単一の固定された合成ユーザー集団を作るのではなく、任意の文脈に応じて多様なペルソナをオンデマンドで生成できる「ペルソナ・ジェネレーター」という関数を定義し、そのコード自体を最適化した点にある。このジェネレーターは、特定の個人を模倣する「忠実度」ではなく、考え得るあらゆる特性、意見、嗜好の空間を網羅する「カバレッジ(網羅性)」の最大化を目的としている。具体的には、短いテキスト記述から出発し、それを構造化された質問票へと拡張し、多様性の軸(次元)を定義する。その上で、これらの軸に沿って、可能な限りの特性の組み合わせを持つ個人の集団を生成する。 このプロセスを実現するために、本研究ではペルソナを生成するための「コード(プロンプトのテンプレートやサンプリングのロジック)」自体を最適化の対象とした。この最適化には、AlphaEvolveに基づいた進化的探索ループが採用されている。…

続きはログイン/プランで閲覧できます。

続きを読む

ログインで全文を月 2 本まで無料で読めます

ログインして続きを読む

無料プランで全文は月 2 本まで読めます。

Related

次に読む