継続更新

生成AI研究を、要点から追う。

最新の論文記事を読みやすく整理。保存・タグ検索に加え、Plus/Proでは研究ノートと知識グラフで理解を積み上げられます。

無料で試す

Cog AI Archive

最新の記事

Fair Recourse for All: 反実仮想説明における個人および集団の公平性の確保

機械学習の意思決定を説明する反実仮想説明(CF)において、似た属性の個人に同様の改善策を出す「個人の公平性」と、保護属性グループ間で機会を均等にする「集団の公平性」を両立する「ハイブリッド公平性」を定義した。

6296 字
読む →

MuVaC:対話におけるマルチモーダルな皮肉理解のための変分因果フレームワーク

ソーシャルメディア上のマルチモーダルな対話における皮肉を理解するため、皮肉の検出(MSD)とその理由の説明(MuSE)を因果的な依存関係として捉える新しい変分因果推論フレームワーク「MuVaC」を提案した。

6404 字
読む →

BMAM:脳に触発されたマルチエージェント記憶フレームワーク

言語モデルベースのエージェントが長期間の対話で情報の整合性や個性を失う現象を「魂の摩耗(soul erosion)」と定義し、その解決策を提案している。 脳の記憶システムを模倣し、記憶をエピソード記憶、意味記憶、顕著性、制御といった機能的に分化されたサブシステムで構成する「BMAM」フレームワークを開発した。

5662 字
読む →

CtrlCoT: 推論の質を保ちつつCoTを圧縮する二重粒度フレームワーク

大規模言語モデルの思考の連鎖(CoT)における冗長性を排除するため、意味レベルの要約とトークンレベルの削減を統合した二重粒度フレームワーク「CtrlCoT」を提案し、推論精度を維持しながら計算コストを大幅に削減することに成功した。

5996 字
読む →

文脈内学習で教育用図表の生成は改善できるか?ハルシネーションが全てを台無しにする場合を除いて

教育分野でのAI活用が進む中、図表生成におけるハルシネーションや不適切なレイアウトが学習者へのリスクとなっているため、修辞構造理論(RST)に基づいた新しい文脈内学習(ICL)手法が提案された。

5934 字
読む →

人間とAIの協力における規範的等価性:混合エージェント集団において協力を促進するのはアイデンティティではなく行動である

3人の人間と1つの自律的エージェント(人間またはAIと表示)で構成されるグループにおいて、公共財ゲームを通じた協力行動の検証が行われました。その結果、参加者の協力レベルは相手が人間かAIかというラベルによって左右されず、グループ全体の振る舞いや過去の行動を維持しようとする慣性によって決定されることが明らかになりました。

5973 字
読む →

FLAIR MRIにおける白質高信号域および脳卒中病変のセグメンテーションのための、部分的にラベル付けされたデータセットを用いた学習戦略の比較評価

FLAIR MRI画像において、見た目が酷似し混同されやすい白質高信号域(WMH)と虚血性脳梗塞病変(ISL)を正確に分離・抽出するため、完全なラベルが揃っていない不完全なデータセットを有効活用する6つの学習戦略を比較検証した。

5809 字
読む →

高度なTTSモデル時代における音声ディープフェイク検出:統合的アプローチの必要性

最新のText-to-Speech(TTS)技術であるDia2、Maya1、MeloTTSは、大規模言語モデルやフローマッチング、階層型コーデックを採用することで、従来の検出器では識別が困難な極めて自然な音声を生成する。

6247 字
読む →

CCMamba: 組み合わせ複体の高次グラフ学習に向けた選択的状態空間モデル

現実世界の複雑なデータ構造を扱うため、グラフやハイパーグラフを包括する「組み合わせ複体」という統一的なトポロジカル枠組みを採用し、線形時間で動作する初のMambaベースの学習モデルであるCCMambaを提案した。

6206 字
読む →

マルチエージェントシステムにおける創発的極端現象の解釈

大規模言語モデル(LLM)を用いたマルチエージェントシステムで発生する、予測困難な「ブラックスワン」現象を解明するため、世界で初めて「時間・個人・行動」の3次元からリスクを定量化する解釈フレームワークを提案しました。

5791 字
読む →