大規模言語モデル(LLM)へのスポンジ攻撃(過剰な計算負荷によるDoS)に対し、従来の防御は攻撃の進化に対応困難でした。本研究は、自己修復機能を備えたマルチエージェント防御フレームワーク「SHIELD」を提案します。防御・知識更新・プロンプト最適化の3種のエージェントが連携し、進化する脅威に対して防御性能を継続的に向上させます。
全文は有料プランで閲覧できます。
Unlock
Pro
Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。
Related