次世代の6Gネットワーク環境において、大規模言語モデル(LLM)を搭載した自律型無人航空機(UAV)エージェントのセキュリティ、回復力、および信頼性を包括的に測定するための初の大規模評価スイート「$\alpha^3$-SecBench」が開発されました。
次世代の6Gネットワーク環境において、大規模言語モデル(LLM)を搭載した自律型無人航空機(UAV)エージェントのセキュリティ、回復力、および信頼性を包括的に測定するための初の大規模評価スイート「$\alpha^3$-SecBench」が開発されました。 このフレームワークは、2万件の検証済み攻撃シナリオと175種類の脅威タイプを用い、主要なIT企業やAI研究所が提供する最新の23種類のLLMを対象に、センシングから推論に至る7つの自律性レイヤーにわたる脆弱性への耐性を厳格に評価しました。 実験の結果、現在のLLMは異常の検知には一定の能力を示すものの、脆弱性の特定や安全な機能低下行動の実行、ポリシーに準拠した制御の維持には深刻な課題があり、総合スコアは12.9%から57.1%という低い水準に留まっていることが判明しました。
現代の自律型無人航空機(UAV)システムは、災害対応、インフラ点検、監視、産業オートメーション、さらには低空経済サービスなど、安全性が極めて重要視される環境での導入が急速に進んでいます。近年の大規模言語モデル(LLM)の飛躍的な進歩は、UAVに高度な推論能力、自然言語による対話、そして動的な環境への適応的な意思決定能力をもたらし、自律性の定義を大きく拡張してきました。特に、超低遅延通信、AIネイティブな制御プレーン、エッジコンピューティングとの連携を特徴とする次世代の6Gネットワークとの統合により、これまでにない規模の自律性と協調的な知能の実現が期待されています。しかし、LLMをUAVの自律制御の核として組み込むことは、従来の評価手法では十分に捉えきれない新しいセキュリティ、回復力、および信頼性の課題を浮き彫りにしています。 これまでの研究の多くは、良好な条件下でのタスク実行性能、学習の収束速度、あるいは複数の機体間での調整効率に焦点を当ててきました。…
本論文では、LLM駆動型UAVエージェントのセキュリティ、回復力、および信頼性を評価するために設計された、世界初の大規模評価スイートである「$\alpha^3$-SecBench」を提案しています。このフレームワークは、先行研究である$\alpha^3$-Benchの多対話型UAVミッションを基盤として構築されており、通常の自律走行エピソードに対して、20,000件もの検証済みセキュリティオーバーレイ攻撃シナリオを付加したものです。これらのシナリオは、UAVの自律性を構成する主要な7つのレイヤー、すなわちセンシング、認識、計画、制御、通信、エッジ/クラウドインフラストラクチャ、およびLLM推論を標的とした、制御された攻撃を注入するように設計されています。…
続きはログイン/プランで閲覧できます。
続きを読む
無料プランで全文は月 2 本まで読めます。
Related