継続更新

生成AI研究を、要点から追う。

最新の論文記事を読みやすく整理。保存・タグ検索に加え、Plus/Proでは研究ノートと知識グラフで理解を積み上げられます。

無料で試す

Cog AI Archive

最新の記事

感情をMEGで拡大する:注釈付き脳データからの感情分析

本研究は、感情ラベルが欠如している既存の脳磁図(MEG)データセットに対し、事前学習済みのテキスト感情分析モデルを用いて自動的に注釈を付与する革新的なパイプラインを提案しました。 シャーロック・ホームズの物語を聴取中の脳活動データと、テキストから抽出した感情スコアを時間軸で精密に統合することで、大規模な訓練データを構築し、脳信号から直接感情を解読するモデルの構築に成功しました。 実験の結果、多層パーセプトロン(MLP)や長短期記憶(LSTM)を用いた予測モデルは、統計的に有意な精度で感情状態を識別でき、非侵襲的な脳計測データから複雑な心理状態を読み取るための概念実証を提示しました。

6489 字
読む →

FLOPsを再利用せよ:非常にオフポリシーなプレフィックスによる条件付けを用いた、困難な問題における強化学習のスケールアップ

大規模言語モデルの数学やコーディング等の難問解決において、正解が稀なために学習が停滞する課題に対し、過去の成功トレースの冒頭部分を「プレフィックス」として与えることでオンポリシー学習を導く新手法「PrefixRL」を提案しました。

7211 字
読む →

インターバル2型ニューロファジィシステムによる下水処理エネルギー予測のための説明可能な不確実性定量化

世界全体の電力の1〜3%を消費する下水処理施設において、持続可能な運用のために高精度な電力需要予測が不可欠ですが、従来の機械学習モデルは点予測に留まり、意思決定の根拠となる不確実性を説明する能力が不足していました。

5675 字
読む →

RealStats:偽画像検出のための実画像のみを用いた統計的フレームワーク

生成AIによる偽画像検出において、未知の生成モデルへの適応性と判定結果の解釈性を両立させるため、実画像のみを利用する統計的枠組み「RealStats」が提案されました。 この手法は、複数の既存検出器から得られる統計量を実画像の分布に基づいた「p値」へと変換し、それらを厳密な統計的手法で統合することで、対象画像が実画像の分布からどれだけ逸脱しているかを確率的に評価します。 学習に偽画像を一切必要としないため、進化し続ける新しい生成モデルに対しても頑健であり、出力されるスコアは「その画像が実画像である確率」として統計的に明確な意味を持つため、信頼性の高い判定を実現しています。

5703 字
読む →

知識蒸留において不確実性はどのように伝播されるのか?

知識蒸留は教師モデルの挙動を生徒モデルへ継承させる手法だが、教師の出力や生徒の初期化、推論時のサンプリングといった確率的な要素が不確実性を生み出す。本研究では、標準的な蒸留が「生徒個体間のばらつき(inter-student uncertainty)」を放置する一方で、「生徒内部の予測の多様性(intra-student uncertainty)」を過度に抑制してしまうというミスマッチを明らかにした。 この不確実性の歪みを解消するために、複数の教師出力を平均化してノイズを低減する手法と、分散に基づいた重み付けを行う「分散を考慮した蒸留(variance-aware distillation)」という2つの戦略を提案した。線形回帰、ニューラルネットワーク、大規模言語モデル(LLM)を用いた検証により、提案手法が教師モデルの不確実性をより正確に反映し、モデルの安定性を向上させることを証明した。 実験の結果、提案手法はLLMにおけるハルシネーション(幻覚)を抑制し、教師モデルが持つ本来の表現力や多様性を生徒モデルに正しく継承させる効果があることが確認された。これにより、知識蒸留を単なる精度の模倣ではなく、不確実性の適切な変換プロセスとして再定義し、医療や法律、金融といった安全性が重視される分野においても信頼性の高い小型モデルの構築が可能となる。

6237 字
読む →

GraIP:ニューラルグラフ逆問題のためのベンチマークフレームワーク

GraIPは、構造発見や因果探索、組み合わせ最適化といった多様なグラフ学習タスクを「逆問題」として統一的に定義し、観測データから潜在的なグラフ構造を復元することを目指す新しい概念フレームワークである。

5915 字
読む →

一つのグローバルモデル、多様な振る舞い:コストを考慮した発注ポリシーを伴うマルチホライズン小売需要予測のための在庫切れを考慮した特徴量エンジニアリングと動的スケーリング(VN2 優勝レポート)

VN2在庫計画チャレンジで優勝した本手法は、需要予測と発注決定を分離した2段階のパイプラインを採用し、在庫切れによる需要の偏りを考慮した特徴量エンジニアリングと動的スケーリングを組み合わせています。

6379 字
読む →

テラバイト規模のデータ統合に向けたバイトオフセット・インデックス・アーキテクチャを用いた大規模ケモインフォマティクスの高速化

現代の創薬研究に不可欠な大規模化学データベースの統合において、従来の総当たり検索では100日以上を要していた計算時間を、バイトオフセットを用いたインデックス・アーキテクチャの導入によりわずか3.2時間へと劇的に短縮しました。

6564 字
読む →

フルランクの行動と状態観測可能性の枠組みを超えたPOMDP学習に向けて

本研究は、隠れ状態を持つシステムの動態を学習するため、予測状態表現(PSR)とテンソル分解の手法を統合し、一部の行動がフルランクであれば離散的な部分観測マルコフ決定過程(POMDP)のパラメータを推定できる新しい枠組みを提案している。

5823 字
読む →

FSD-CAP:グラフ特徴量補完のためのクラス認識型伝播を用いた部分的サブグラフ拡散

FSD-CAPは、ノード特徴量の99.5%が欠損しているという極限状態のグラフデータにおいて、全データが揃っている状態に匹敵する精度で特徴量を復元・補完する新しい学習フレームワークである。 局所的なグラフ構造に応じて情報の伝播強度を調整する「分数拡散オペレータ」と、観測済みノードから段階的に探索範囲を広げる「部分的サブグラフ拡張」を組み合わせることで、広域拡散による誤差の蓄積を抑えつつ、安定した特徴量推定を可能にしている。 さらに、推定された特徴量から得られる疑似ラベルと近傍のラベル一貫性(エントロピー)を利用した「クラス認識型伝播」を導入することで、クラス内の整合性を高め、ノード分類やリンク予測といった下流タスクにおいて既存手法を圧倒する性能を達成した。

6062 字
読む →