継続更新

実環境におけるゼロショット・スタンス検出:動的ターゲット生成とマルチターゲット適応

従来の立場検出は事前に定義された静的なターゲットを前提としていたが、本研究では現実のソーシャルメディアの複雑さに対応するため、ターゲットの事前知識なしにテキストから複数のターゲットと立場のペアを自動識別する「DGTA」という新しいタスクを定義し提案した。

実環境におけるゼロショット・スタンス検出:動的ターゲット生成とマルチターゲット適応 の図解
論文図解

TL;DR(結論)

従来の立場検出は事前に定義された静的なターゲットを前提としていたが、本研究では現実のソーシャルメディアの複雑さに対応するため、ターゲットの事前知識なしにテキストから複数のターゲットと立場のペアを自動識別する「DGTA」という新しいタスクを定義し提案した。 このタスクを検証するために、中国のソーシャルメディアから収集した70,931件の高品質な注釈付きデータセットを構築し、意味的類似性や表面的な一致、数量の整合性を統合した多次元的な評価指標である「C-Score」を新たに設計してモデルの性能を厳密に測定した。 大規模言語モデル(LLM)を用いた実験の結果、二段階の微調整を行ったQwen2.5-7Bがターゲット認識で最高スコアを記録し、統合的な微調整を行ったDeepSeek-R1-Distill-Qwen-7Bが立場検出において高いF1スコアを達成するなど、微調整されたLLMが従来のモデルを大幅に上回る優れた性能を示すことを証明した。

なぜこの問題か

現在の立場検出に関する研究の多くは、あらかじめ与えられた特定のターゲットとテキストに基づいて、そのターゲットに対する態度が「支持」「反対」「中立」のいずれであるかを予測することに依存している。しかし、現実世界のソーシャルメディアという「野生」の環境においては、議論の対象となるターゲットは事前に定義されているわけではなく、また静的なものでもない。ソーシャルメディア上のトピックは多岐にわたり、議論の対象同士が密接に関連しているため、ターゲットが不明確であったり、一つのテキストの中に複数のターゲットが共存していたりすることが頻繁に発生する。このような環境では、単一のテキストが複数の立場ターゲットを含んでいる可能性があり、それぞれの立場ラベルはターゲット間の複雑な関係性と結びついている。 例えば、ある電気自動車に関する投稿では、特定のブランドには好意的でありながら、別のブランドには否定的な見解を示すといったケースが考えられる。…

核心:何を提案したのか

本研究では、野生環境におけるゼロショット立場検出(Zero-Shot Stance Detection in the Wild)という概念を導入し、動的ターゲット生成と複数ターゲット適応(DGTA)という新しいタスクを提案した。このタスクの核心は、モデルが事前のターゲット知識に頼ることなく、テキストから複数の「ターゲットと立場のペア」を自動的に識別することにある。ここで定義されるターゲットは、人物、組織、機関といった静的なエンティティだけでなく、行動、イベント、概念的または抽象的な状態といった動的なエンティティも含まれる。この新しいタスクをサポートするために、中国のソーシャルメディアプラットフォームであるWeiboから収集したデータに基づく、高品質な多ドメイン立場検出データセットを構築した。…

続きはログイン/プランで閲覧できます。

続きを読む

ログインで全文を月 2 本まで無料で読めます

ログインして続きを読む

無料プランで全文は月 2 本まで読めます。

Related

次に読む