地方自治体が公開する議事録は、官僚的で難解な記述スタイルや膨大な文書量により、市民やジャーナリストが特定の情報を効率的に検索することが困難であるという課題を抱えている。本研究では、大規模言語モデル(LLM)であるGemini 2.
地方自治体が公開する議事録は、官僚的で難解な記述スタイルや膨大な文書量により、市民やジャーナリストが特定の情報を効率的に検索することが困難であるという課題を抱えている。本研究では、大規模言語モデル(LLM)であるGemini 2.0 Flashを活用し、非構造化データである議事録からメタデータ、議論の主題、投票結果を自動抽出して構造化するプラットフォーム「CitiLink」を開発した。ポルトガルの6つの自治体から提供された120件の議事録を用いた検証の結果、メタデータ抽出で0.84という高いF1スコアを記録し、自治体職員によるユーザビリティテストでも直感的な操作性が高く評価されるなど、行政の透明性と市民参加を促進する有効なツールであることが実証された。
地方自治体の議会において作成される議事録は、行政の透明性を評価するための重要な指標の一つとして位置づけられている。多くの自治体では情報の公開が進められているが、公開されている文書の多くは非常に長大であり、かつ官僚的で形式的な記述スタイル、いわゆる行政専門用語が多用されている。このような記述は、専門的な知識を持たない一般の市民や、迅速な情報収集を必要とするジャーナリストにとって、内容を正確に把握するための大きな障壁となっている。単にPDFなどのファイルが公開されているだけでは、特定の議論や決定事項を効率的に探し出すことは極めて困難であり、非構造化データとしての性質が情報の利活用を妨げている。 先行研究においては、議会のビデオ記録の解析や活用に関する調査は行われてきたものの、書面による議事録の構造化や活用については、これまで十分に探索されてこなかった領域である。特に欧州ポルトガル語の文書に関しては、その言語的特性や行政特有の表現を扱うための技術的なアプローチが不足していた。行政情報の公開は民主主義の根幹をなす要素であるが、情報へのアクセスが実質的に制限されている現状は、市民の政治参加を阻む要因となっている。…
本研究では、地方自治体の非構造化な議事録を、構造化された検索可能なデータへと変換する革新的なプラットフォーム「CitiLink」を提案した。このシステムは、最新の自然言語処理技術と情報検索技術を統合することで、地方政府の意思決定プロセスを可視化し、市民のアクセシビリティを向上させることを目的としている。具体的には、大規模言語モデル(LLM)であるGemini 2.0 Flashを採用し、議事録のテキストから重要な情報を自動的に抽出する高度なパイプラインを構築した。 抽出の対象は、大きく分けて3つの層で構成されている。第一の層は「メタデータ」であり、会議の参加者、開催場所、日付、会議の種類といった基本的な属性情報を抽出する。第二の層は「議論の主題」であり、会議で話し合われた具体的なトピックや案件の要約を生成する。…
続きはログイン/プランで閲覧できます。
続きを読む
無料プランで全文は月 2 本まで読めます。
Related