論文検索 新着 人気 料金
運営: Cognitive Research Labs(CRL) crl.co.jp
毎日更新
AI Data Base

生成AIの最新動向を、読みやすいアーカイブで。

AI研究の要点を整理。最新の論文記事をカテゴリやタグで探索できます。

運営: Cognitive Research Labs(CRL) / crl.co.jp

新着 論文 人気 料金 無料で試す
Popular

RedSage: サイバーセキュリティに特化した汎用LLM

TL;DRRedSageは、プライバシーリスクを回避しつつ多様なセキュリティ業務を支援するために開発された、オープンソースのサイバーセキュリティ特化型LLMである。118億トークンの専門データによる事前学習と、エージェントベースのパイプラインで生成された26.6万件の指示データによる調整を経て、既存モデルを上回る性能を実現した。

Cog AI Archive

最新の記事

人気記事ピックアップ

RedSage: サイバーセキュリティに特化した汎用LLM

TL;DRRedSageは、プライバシーリスクを回避しつつ多様なセキュリティ業務を支援するために開発された、オープンソースのサイバーセキュリティ特化型LLMである。118億トークンの専門データによる事前学習と、エージェントベースのパイプラインで生成された26.6万件の指示データによる調整を経て、既存モデルを上回る性能を実現した。

AI研究 2026-01-29 閲覧 36 クリック 16

粒子からエージェントへ:空間シミュレーションにおける認知的摩擦の指標としてのハルシネーション

TL;DR従来の建築シミュレーションは要素を物理的な「粒子」として扱ってきましたが、本研究では大規模マルチモーダルモデルを用いた「エージェンティック環境シミュレーション」を提案します。AIのハルシネーションを診断ツールとして利用し、空間内の意味的な曖昧さ(ファントム・アフォーダンス)を検出する枠組みを提示しています。

読了 0 分 1445 字
読む →

ウェブエージェントは見た目に左右されるか?UIデザイン要因の包括的評価

TL;DRウェブエージェントの意思決定における視覚的属性の影響を定量化する評価パイプライン「VAF」を提案した研究です。背景色のコントラスト、アイテムのサイズ、配置位置などがエージェントの行動に強く影響する一方、フォントスタイルやテキスト色の影響は軽微であることが、5つの実在サイトと4種のエージェントを用いた実験で明らかになりました。

読了 0 分 1462 字
読む →

大型言語モデルの制御におけるスタイルベクトルの有効性:人間による評価

TL;DR本研究は、LLMの内部活性化を直接修正して出力を制御する「活性化ステアリング」の有効性を、人間による評価を通じて検証しました。7,000件以上の評価データを分析した結果、適切な強度での制御がテキストの品質を保ちつつ感情を増幅できることが判明しました。特に嫌悪や恐怖の感情で高い効果が確認されています。

読了 0 分 1233 字
読む →

LLMの感情制御におけるスタイルベクトルの有効性:人間による評価

TL;DR本研究は、LLMの内部活性化を調整して出力を制御する「アクティベーション・ステアリング」の有効性を、人間による評価を通じて検証しました。7,000件以上の評価データを分析した結果、適度な強度での制御が品質を保ちつつ感情を増幅できることが判明しました。特に嫌悪や恐怖の感情制御で高い効果が確認されています。

読了 0 分 1318 字
読む →

協調学習のための動的フレームワーク:適応型フィードバック機構を備えた高度なLLMの活用

TL;DR本研究は、大規模言語モデル(LLM)を協調学習プラットフォームの動的なモデレーターとして統合するフレームワークを提案します。リアルタイムの議論促進や適応型フィードバック、参加の均衡化を通じて、学習者のエンゲージメントや批判的思考、包摂性を高めます。

読了 0 分 1273 字
読む →

構造的障壁としての管轄権:プライバシーポリシーの構成が実質的開示の可視性を低下させる可能性

TL;DR構造的障壁としての管轄権:プライバシーポリシーの構成が実質的開示の可視性を低下させる可能性 arXiv 要約 背景。 技術要点 インパクト。 限界 次の一手 --- 論文情報 - URL: http://arxiv.org/abs/2601.20792v1。

読了 0 分 197 字
読む →

礼儀正しさは退屈?チャットボットのフィードバックにおける「関与」と「心理的抵抗」のトレードオフ

TL;DR行動変容を促す対話エージェントにおいて、フィードバックのスタイルがユーザーに与える影響を調査した研究。「直接的」「丁寧」「言い淀み(Verbal Leakage)」の3つのスタイルを比較した結果、「丁寧」さは心理的抵抗を下げるが退屈とみなされ、「言い淀み」は抵抗を生む一方で関与度や意外性を高めるというトレードオフが明らかになった。

読了 0 分 1359 字
読む →

AGENTS.mdファイルがAIコーディングエージェントの効率に与える影響

TL;DRAIコーディングエージェントの効率にリポジトリ設定が与える影響を検証。10リポジトリ・124 PRの実験で、AGENTS.md導入により実行時間中央値が約29%短縮、出力トークンが約17%削減された。

読了 0 分 1249 字
読む →

セミカスケード型全二重対話システムのためのユニットベースエージェント

TL;DR自然な音声対話を実現するため、複雑な対話を最小単位の会話ユニットに分解して処理するフレームワークを提案しています。マルチモーダル大規模言語モデル(LLM)を中心としたセミカスケード型システムにより、トレーニング不要かつプラグアンドプレイでの動作を実現。HumDialデータセットを用いた実験で高い有効性が示されています。

読了 0 分 1234 字
読む →

HARMONI:LLMを用いた多人数対ロボット相互作用のマルチモーダルなパーソナライズ

TL;DRHARMONIは、大規模言語モデル(LLM)を活用し、社会的支援ロボットが長期間のマルチユーザー対話を管理するためのフレームワークです。話者識別、環境理解、ユーザーモデリング、応答生成の4つのモジュールを統合し、高齢者施設での実証実験を通じて、ベースラインよりも高い個別化精度とユーザー満足度を実証しました。

読了 0 分 1282 字
読む →
保存済みの記事がまだありません。
読み込み中…

Pricing

論文×チャット×知識DBを続けるなら

Free

¥0
  • 要約閲覧
  • 全文は月 2 本まで
  • チャットは月 3 回まで
無料で始める

Plus

¥1,780 / 月
  • 全文閲覧無制限
  • スレッド保存
  • Flashモデル
  • チャット上限 300 回/月
Plusで始める

Pro

¥2,980 / 月
  • 全文閲覧無制限
  • スレッド保存
  • 長文回答(Proモデル)
  • チャット上限 800 回/月
Proで始める