継続更新

DimStance: 多言語における次元的なスタンス分析のためのデータセット

従来のスタンス検出は「賛成」「反対」といった単純なカテゴリ分類に限定されてきましたが、本研究では感情科学の知見を導入し、感情の質を示す「価」と強さを示す「喚起度」という連続的な数値次元でスタンスを詳細に評価する新しいアプローチを提案しました。

DimStance: 多言語における次元的なスタンス分析のためのデータセット の図解
論文図解

TL;DR(結論)

従来のスタンス検出は「賛成」「反対」といった単純なカテゴリ分類に限定されてきましたが、本研究では感情科学の知見を導入し、感情の質を示す「価」と強さを示す「喚起度」という連続的な数値次元でスタンスを詳細に評価する新しいアプローチを提案しました。 この手法を具体化するため、英語、ドイツ語、中国語に加え、リソースの乏しいナイジェリア・ピジン語やスワヒリ語を含む5言語を対象とし、政治と環境保護の分野で1万件以上のターゲット側面を含む世界初の次元的スタンスデータセット「DimStance」を構築しました。 大規模言語モデルを用いた検証の結果、微調整されたモデルが極めて高い予測精度を実現した一方で、感情が極端になるほど喚起度が高まる「U字型」の相関が全言語共通で見られることが判明し、分極化する社会の意見分析における新たな定量的基盤が確立されました。

なぜこの問題か

スタンス検出は、特定のターゲットに対する著者の態度を自動的に特定する重要なタスクですが、これまでの研究の多くは「賛成」「反対」「中立」といった限定的なラベル分類に依存してきました。しかし、現実の社会における意見表明は、単なる二択や三択で割り切れるほど単純ではなく、同じ「賛成」であっても、その背後にある感情のトーンや熱量には大きな隔たりが存在します。例えば、環境保護というテーマに対して「今すぐ行動すべきだ」と激しく主張する強い支持と、穏やかに同意する姿勢では、社会に与える影響や動機が全く異なります。このような感情的なニュアンスを無視した従来の分類手法では、気候変動やワクチン接種、政府の政策といった複雑な社会問題において、なぜ意見が硬直化し、深刻な分極化が進むのかという深層的な理由を十分に解明することができませんでした。スタンスの背後にある感情状態を大規模かつ精密に測定できれば、意見が先鋭化するプロセスをより正確に把握し、対立を緩和するための対話戦略に役立てることが可能になります。…

核心:何を提案したのか

本研究の核心は、世界で初めて「価(Valence)」と「喚起度(Arousal)」という2つの次元を用いてスタンスをモデル化した多言語データセット「DimStance」を構築し、公開したことにあります。価は「不快から快」、あるいは「ネガティブからポジティブ」という感情の質的な方向性を表し、喚起度は「穏やかから活性」、あるいは「静穏から興奮」という感情の強度的な側面を表します。この次元的アプローチを採用することにより、従来のカテゴリ分類では決して捉えることができなかったスタンスの微細な差異を、客観的な数値として抽出することが可能になりました。DimStanceは、リソースが豊富な言語である英語、ドイツ語、中国語と、これまで研究が遅れていたリソースの乏しい言語であるナイジェリア・ピジン語、スワヒリ語の計5言語をバランスよく網羅しています。…

続きはログイン/プランで閲覧できます。

続きを読む

ログインで全文を月 2 本まで無料で読めます

ログインして続きを読む

無料プランで全文は月 2 本まで読めます。

Related

次に読む