論文検索 新着 人気 料金
運営: Cognitive Research Labs(CRL) crl.co.jp
毎日更新
AI DATA BASE

生成AI研究を、要点から追う。

最新の論文記事を読みやすく整理。カテゴリとタグで横断して探せます。

運営: Cognitive Research Labs(CRL)

新着 論文 人気 料金 無料で試す
Popular

RedSage: サイバーセキュリティに特化した汎用LLM

TL;DRRedSageは、プライバシーリスクを回避しつつ多様なセキュリティ業務を支援するために開発された、オープンソースのサイバーセキュリティ特化型LLMである。118億トークンの専門データによる事前学習と、エージェントベースのパイプラインで生成された26.6万件の指示データによる調整を経て、既存モデルを上回る性能を実現した。

Cog AI Archive

最新の記事

人気記事ピックアップ

RedSage: サイバーセキュリティに特化した汎用LLM

TL;DRRedSageは、プライバシーリスクを回避しつつ多様なセキュリティ業務を支援するために開発された、オープンソースのサイバーセキュリティ特化型LLMである。118億トークンの専門データによる事前学習と、エージェントベースのパイプラインで生成された26.6万件の指示データによる調整を経て、既存モデルを上回る性能を実現した。

AI研究 2026-01-29 閲覧 41 クリック 17

脚本こそが必要な全て:長期的な対話から映画風動画を生成するためのエージェントフレームワーク

最近の動画生成モデルは単純なプロンプトから美しい映像を作成できますが、対話のような抽象的概念から一貫した長編物語を作るのは困難でした。本研究では、この「意味的ギャップ」を埋めるため、対話を詳細な撮影脚本に変換するScripterAgentと、それを基に動画生成を指揮するDirectorAgentを組み合わせた新たなフレームワークを提案します。

読了 0 分 1268 字
読む →

視覚的換喩への計算論的アプローチ

画像が文字通りの描写を超えて意味を伝える「視覚的換喩(Visual Metonymy)」に関する初の計算的調査を行った研究である。記号論に基づいたパイプラインを提案し、2,000件の多肢選択問題からなるデータセット「ViMET」を構築。

読了 0 分 1146 字
読む →

BanglaRobustNet:堅牢なベンガル語音声認識のためのハイブリッドなノイズ除去アテンションアーキテクチャ

バングラ語音声認識において、ノイズや話者の多様性に対応する「BanglaRobustNet」が提案された。Wav2Vec-BERTを基盤に、拡散ベースのノイズ除去と話者情報を考慮した注意機構を統合したハイブリッドモデルである。Mozilla Common Voiceなどでの評価により、ベースラインと比較してWERとCE

読了 0 分 1289 字
読む →

SpatialMath: 数学的な問題解決のための空間理解を注入した記号推論

幾何学問題において、中小規模のマルチモーダル言語モデル(MSLM)は視覚理解と数学的推論の連携に課題を抱えています。本研究では、図形から空間情報を抽出して記号推論に組み込む「SpatialMath」を提案。新データセットMATHVERSE-PLUSも構築し、視覚集約的な問題でベースラインを最大10ポイント上回る精度を達成しました。

読了 0 分 1455 字
読む →
保存済みの記事がまだありません。
読み込み中…

Pricing

論文×チャット×知識DBを続けるなら

Free

¥0
  • 要約閲覧
  • 全文は月 2 本まで
  • チャットは月 3 回まで
無料で始める

Plus

¥1,780 / 月
  • 全文閲覧無制限
  • スレッド保存
  • Flashモデル
  • チャット上限 300 回/月
Plusで始める

Pro

¥2,980 / 月
  • 全文閲覧無制限
  • スレッド保存
  • 長文回答(Proモデル)
  • チャット上限 800 回/月
Proで始める