継続更新

生成AI研究を、要点から追う。

最新の論文記事を読みやすく整理。保存・タグ検索に加え、Plus/Proでは研究ノートと知識グラフで理解を積み上げられます。

無料で試す

Cog AI Archive

最新の記事

複数ソースの教師なしドメイン適応に向けた分布頑健な分類手法

本研究は、教師なしドメイン適応(UDA)において、標的ドメインのラベルなしデータが極端に不足している状況や、訓練データに「偽の相関」が含まれる場合に生じる性能低下を克服するための、革新的な分布頑健学習(DRO)フレームワークを提案している。

6613 字
読む →

オンデマンド・エアタクシーサービスのための異種垂直離着陸場選択の最適化:深層強化学習によるアプローチ

都市部の深刻な交通渋滞を解消するため、電動垂直離着陸機(eVTOL)と地上交通を統合管理し、深層強化学習とV2X通信を活用して乗客ごとに最適な離着陸場(バーティポート)を動的に割り当てる「UAGMC」フレームワークを提案しました。

5795 字
読む →

人間を模倣した推論によるホワイトボックス・オペアンプ設計

アナログ回路の基本要素である演算増幅器(オペアンプ)の設計において、従来のベイズ最適化などのブラックボックス手法は物理的根拠に乏しく、設計意図が不明確であるため、下流のトランジスタレベルへの移行時に設計不備や失敗を招くという課題がありました。

6407 字
読む →

LLMの創造的タスクにおけるモデル内およびプロンプト間の変動分析

大規模言語モデル(LLM)の創造的出力における分散を詳細に分析した結果、出力の質である「独創性」についてはプロンプトが36.43%、モデルの選択が40.94%の影響力を持ち、両者が同等に重要であることが判明した。 一方で出力の量である「流暢性」については、モデルの選択が51.

7515 字
読む →

Ostrakon-VL:飲食・小売店向けドメインエキスパートMLLMに向けて

飲食・小売店舗(FSRS)の現場では、監視カメラのノイズや複雑な推論要求により汎用モデルの性能が低下するという課題がありましたが、本研究ではQwen3-VL-8Bを基盤としたドメイン特化型モデル「Ostrakon-VL」を開発しました。

5919 字
読む →

自己改善型事前学習:事後学習済みモデルを用いた、より優れたモデルの事前学習

大規模言語モデルの安全性や事実性を根本から高めるため、従来の次単語予測に代わり、事後学習済みの強力なモデルを「判定役」および「書き換え役」としてループに組み込み、強化学習を用いてシーケンス単位で最適化する「自己改善型事前学習」を提案している。

6633 字
読む →

協調学習のための動的フレームワーク:適応型フィードバック機構を備えた高度なLLMの活用

本研究では、高度な大規模言語モデルであるGPT-4oを動的なモデレーターとして統合し、リアルタイムでの議論促進と学習者のニーズへの適応を可能にする新しい協調学習フレームワークを提案しました。検索拡張生成(RAG)技術と多層的なフィードバック機構を組み合わせることで、従来の静的なシステムでは困難だった参加者間の公平な関与の促進や、文脈に応じた柔軟なプロンプト調整を実現しています。FairytaleQAデータセットを用いた検証により、学生のエンゲージメント向上や批判的思考の育成、さらには多様な学習環境におけるスケーラビリティと包括的な教育体験の提供が確認されました。

6090 字
読む →

デノイジングの視点から拡散モデルの記憶を制御する手法の提案

拡散モデルの学習において、タイムステップを一様にサンプリングすると信号対雑音比(SNR)の変動により学習の寄与が不均衡になり、特定の訓練データを過度に再現する「記憶」が生じる問題を、デノイジングの動態を重視する視点から解明した。

7269 字
読む →

分離型LLMサービングにおける理論的に最適なAttention/FFN比率

大規模言語モデルの推論効率を最大化するため、状態を持つAttention層と計算集約的なFFN層を分離して実行するAFDアーキテクチャにおいて、両者の最適なリソース配分比率を決定する理論的枠組みが構築された。

5877 字
読む →

BEAP-Agent:GUIエージェントのためのバックトラック可能な実行と適応的プランニング

従来のGUIエージェントは、一度誤った操作を行うと復旧が困難でタスク失敗に直結するという課題がありましたが、本研究ではタスク実行を「深さ優先探索(DFS)」としてモデル化し、長距離かつ多段階のバックトラックを可能にする新フレームワーク「BEAP-Agent」を提案しました。

5880 字
読む →