従来の立場検出はあらかじめ定義されたターゲットに依存していましたが、現実のソーシャルメディアではターゲットが動的で複雑であるため、未知のターゲットを自動特定し立場を判定する新タスク「DGTA」が提案されました。
従来の立場検出はあらかじめ定義されたターゲットに依存していましたが、現実のソーシャルメディアではターゲットが動的で複雑であるため、未知のターゲットを自動特定し立場を判定する新タスク「DGTA」が提案されました。この研究では、中国のソーシャルメディアから収集した70,931件の高品質なデータセットを構築し、大規模言語モデルに対して「統合型」と「二段階型」の2つのファインチューニング戦略を適用して、その有効性を多角的な指標で検証しています。実験の結果、二段階型で調整されたQwen2.5-7Bがターゲット認識で66.99%の総合スコアを記録し、統合型で調整されたDeepSeek-R1-Distill-Qwen-7Bが立場検出で79.26%のF1スコアを達成するなど、ファインチューニングされたモデルが優れた性能を示しました。
現代の立場検出研究における主要な課題は、モデルが特定のターゲットに対して「支持」「反対」「中立」を判断する際、そのターゲットが事前に定義されていることを前提としている点にあります。しかし、現実世界のソーシャルメディア環境では、議論の対象となるターゲットは決して静的ではなく、トピックの多様性や関連性によって極めて複雑かつ動的に変化するという性質を持っています。一つの投稿の中に複数のターゲットが共存しているケースも頻繁に見られ、それらのターゲット間には複雑な関係性が存在するため、従来の単一ターゲットを想定した手法では十分に対応できないという問題が生じていました。例えば、特定の製品の価格戦略には魅力を感じつつも、競合他社の性能をより高く評価し、さらに別の企業の市場での立ち位置には否定的な見解を示すといった、多層的な立場が一つのテキストに含まれることが珍しくありません。 このようなオープンな環境では、ターゲットのラベル空間やテキストあたりのターゲット数が事前に決まっていないため、モデルにはテキストから全ての言及対象を動的に特定し、それぞれに対して適切な立場を割り当てる能力が求められます。…
本研究では、これらの課題を解決するために「動的ターゲット生成と複数ターゲット適応を伴う野生環境でのゼロショット立場検出(DGTA)」という新しいタスクを提案しています。このタスクの核心は、事前のターゲット知識を一切持たない状態で、テキストから自動的に複数のターゲットと立場のペアを特定することにあり、より実用的なソーシャルメディア分析を可能にすることを目指しています。研究チームは、このタスクを評価するために、中国のソーシャルメディアプラットフォームであるWeiboから収集した70,931件の高品質な注釈付きサンプルを含む、マルチドメインの立場検出データセットを構築しました。…
続きはログイン/プランで閲覧できます。
続きを読む
無料プランで全文は月 2 本まで読めます。
Related