継続更新

COMIC:エージェントでスケッチコメディ動画を自動生成する

COMIC は、キャラクター画像・音声・短い説明から、サタデー・ナイト・ライブ風の短いスケッチコメディ動画を全自動で作るエージェント型動画生成システムです。 企画、脚本、批評、編集、演出、レンダリング批評を複数エージェントに分け、しかも YouTube 上の視聴者エンゲージメントに合わせて批評家を選抜することで、「人が笑うか」に寄せた反復改善ループを作っています。 実験では agentic baseline や生の frontier video model を上回り、プロ制作スケッチに近い品質まで迫ったとされ、ユーモアのような主観タスクでも批評家の設計が性能を大きく左右することを示しました。

COMIC:エージェントでスケッチコメディ動画を自動生成する の図解
論文図解

TL;DR(結論)

  • COMIC は、キャラクター画像・音声・短い説明から、サタデー・ナイト・ライブ風の短いスケッチコメディ動画を全自動で作るエージェント型動画生成システムです。
  • 企画、脚本、批評、編集、演出、レンダリング批評を複数エージェントに分け、しかも YouTube 上の視聴者エンゲージメントに合わせて批評家を選抜することで、「人が笑うか」に寄せた反復改善ループを作っています。
  • 実験では agentic baseline や生の frontier video model を上回り、プロ制作スケッチに近い品質まで迫ったとされ、ユーモアのような主観タスクでも批評家の設計が性能を大きく左右することを示しました。

なぜこの問題か

動画生成モデルは急速に良くなっていますが、長めの一貫した物語や、複数登場人物が絡むユーモアはまだ不安定です。スケッチコメディでは、脚本時点のアイデアの面白さだけでなく、映像化したときの間や構図、演技のつながりまで必要になります。つまり、テキスト生成・映像生成・評価の三つを別々に良くしても、それだけではまとまった作品になりません。

核心:何を提案したのか

COMIC の核心は、Multi-agent Iterative Competition によるスケッチコメディ動画生成です。入力として、キャラクター参照画像、音声サンプル、短い人物説明などを受け取り、そこから複数の脚本候補を作り、それらを批評家委員会が pairwise に比較し、負けた案を改稿していく構造を取ります。脚本段階から競争と改善を回すのが特徴です。

続きはログイン/プランで閲覧できます。

続きを読む

ログインで全文を月 2 本まで無料で読めます

ログインして続きを読む

無料プランで全文は月 2 本まで読めます。

Related

次に読む