AI研究 2026-02-04 タグ: cs.LG, eess.SY

公平性を重視した人間中心の交通信号制御：マルチエージェント行動分岐深層強化学習によるアプローチ

従来の車両台数や待ち時間を優先する「車両中心」の信号制御から、歩行者や公共交通機関の利用者を含むすべての移動者の公平性を最適化する「人間中心」のフレームワーク「MA2B-DDQN」を提案し、都市交通における公平性と持続可能性の両立を目指しました。

論文図解

TL;DR（結論）

従来の車両台数や待ち時間を優先する「車両中心」の信号制御から、歩行者や公共交通機関の利用者を含むすべての移動者の公平性を最適化する「人間中心」のフレームワーク「MA2B-DDQN」を提案し、都市交通における公平性と持続可能性の両立を目指しました。複雑な交通制御を、個別の交差点における局所的な時間配分と、ネットワーク全体での合計時間を決定する広域的な行動に分解する「行動分岐構造」を採用することで、大規模なネットワークにおいても効率的かつスケーラブルな協調制御と学習の収束を可能にしました。メルボルンの現実的な交通シナリオを用いた広範な検証により、提案手法は既存の深層強化学習や従来の制御手法と比較して、遅延の影響を受ける移動者の数を大幅に削減し、多様な環境下で極めて高い堅牢性と公平性を実現できることが実証されました。

なぜこの問題か

世界的な人口増加と急速な都市化の進展に伴い、効率的で多様な交通手段への需要はかつてないほど高まっています。これに対応するため、徒歩、自転車、公共交通機関、自家用車を統合したマルチモーダルな交通システムの構築が急務となっていますが、そこでは公平性と平等性が極めて重要な原則となります。公平な交通システムとは、経済状況や身体的状況、地理的な場所に関わらず、すべてのコミュニティ層が等しくアクセスできる状態を指します。しかし、従来の交通工学の分野では、こうした公平性の概念が十分に反映されておらず、交通計画の段階に留まっていることが少なくありません。交通信号制御（TSC）は、交差点での移動を調整してネットワーク全体の効率を高める役割を担いますが、動的で複雑、かつ確率的な特性を持つため、非常に困難な課題とされています。従来の定周期制御では動的な渋滞に対応できず、手動制御は時間と労力の面で非効率です。既存の適応型信号制御システムであるSCOOTやSCATSも世界中で導入されていますが、これらは主に車両交通を対象として設計されており、歩行者や自転車利用者を十分に考慮するためにはさらなる改良が必要です。…

核心：何を提案したのか

本研究では、マルチモーダルな回廊において移動者の公平性を明示的に最適化する、人間中心のマルチエージェント行動分岐深層二重Qネットワーク（MA2B-DDQN）フレームワークを提案しました。このモデルの最大の特徴は、交通信号の制御を「行動分岐」という手法を用いて構造化した点にあります。具体的には、回廊全体の制御を二つの要素に分解します。第一の要素は、個々の交差点において次の二つのフェーズ間で青時間をどのように配分するかを決定する「局所的な行動」です。第二の要素は、それらフェーズの合計時間を決定する「単一の広域的な行動」です。この分解手法により、離散制御下でのスケーラブルな調整が可能となり、共同意思決定に伴う実質的な複雑さを大幅に軽減することができます。…

続きはログイン/プランで閲覧できます。

ログインで全文を月 2 本まで無料で読めます

ログインして続きを読む

無料プランで全文は月 2 本まで読めます。