継続更新

生成AI研究を、要点から追う。

最新の論文記事を読みやすく整理。保存・タグ検索に加え、Plus/Proでは研究ノートと知識グラフで理解を積み上げられます。

無料で試す

Cog AI Archive

最新の記事

コルモゴロフ・アーノルド・ネットワークにおけるグリッド適応のための動的フレームワーク

本研究は、コルモゴロフ・アーノルド・ネットワーク(KAN)の学習において、グリッドのノット配置を最適化するための「重要度密度関数(IDF)」に基づく新しい動的フレームワークを提案しました。従来の入力データの密度のみに依存する手法とは異なり、関数の幾何学的複雑さや学習中のダイナミクスを反映させるため、出力の曲率(2階偏導関数の和)を指標としてノットを再配置する戦略を導入しています。合成関数、Feynmanデータセット、および物理情報機械学習(PIML)を用いた検証の結果、提案手法は従来手法と比較して相対誤差を平均で9.4%から25.3%削減し、計算コストの増加を最小限に抑えつつ高い精度と安定性を実現したことが確認されました。

7137 字
読む →

準モンテカルロ法は極めて低次元の深層生成モデルを実現する

準モンテカルロ法(QMC)を活用した新しい深層生成モデル「QLVM」は、わずか1次元から3次元という極めて低次元な潜在空間において、従来の変分オートエンコーダ(VAE)や重要度重み付けオートエンコーダ(IWAE)を凌駕する性能を発揮します。

6160 字
読む →

低リソース環境におけるネパール語のニューラル多話者ボイスクローニング

本研究は、データ資源が極めて乏しいネパール語において、わずかな音声サンプルから特定の個人の声を再現する「フューショット音声クローニング」システムを開発しました。 システムは、話者の特徴を抽出するエンコーダ、デバナガリ文字からメルスペクトログラムを生成するTacotron2、そして高品質な音声を合成するWaveRNNの3つの主要なニューラルネットワークを統合して構成されています。 833名の話者による235時間の広範なデータセットを用いた検証の結果、未知の話者に対しても高い類似性と自然な音声品質を実現し、低リソース言語におけるパーソナライズされた音声合成の基盤を確立しました。

5898 字
読む →

ハードウェアトロイ検出のための説明可能性手法:体系的な比較

本研究は、ゲートレベルでのハードウェア・トロイの木馬検出において、ドメイン知識を活用した属性分析、事例ベース推論、モデル非依存の重要度算出という3つの説明可能AI(XAI)手法を系統的に比較し、実務的な有用性を検証しました。

6194 字
読む →

継続的ファインチューニングにおける大規模言語モデルの破滅的忘却のメカニズム的分析

109Bから1.5T規模の大規模言語モデルを対象に、継続学習における破滅的忘却の内部メカニズムを分析し、下位層の注意機構での勾配干渉、中間層の表現ドリフト、損失曲面の平坦化という3つの主要要因を特定した。

5861 字
読む →

TEA-Bench:ツール強化型感情支援対話エージェントの体系的ベンチマーク

従来の感情支援対話(ESC)は共感的な発話に偏り、現実の状況に基づいた具体的な助言が不足することで、AIが事実を捏造し信頼を損なうハルシネーションの問題を抱えていました。本研究は、外部ツールを活用して事実に基づいた「道具的支援」を行う能力を評価する初の対話型ベンチマーク「TEA-Bench」を提案し、31種のツールを備えた環境で9種の大規模言語モデルの性能を体系的に検証しました。検証の結果、ツールの導入は感情支援の質を向上させハルシネーションを劇的に抑制しますが、その効果はモデルの基礎能力に強く依存しており、強力なモデルほどツールを適切に選択して活用できる一方で、能力の低いモデルはツールの情報を統合できず混乱する傾向が判明しました。

5988 字
読む →

曖昧から厳密へ:有理数演算による無限深度推論のためのHaloアーキテクチャ

現在の深層学習が依存する浮動小数点演算の近似誤差が、深い推論における「論理的な幻覚」や「セマンティック・ドリフト」の根本原因であると特定し、これを排除するための新しい計算パラダイムを提案した。 有理数演算(Q)を基盤とする「Haloアーキテクチャ」と専用ハードウェア「Exact Inference Unit(EIU)」を導入することで、誤差の蓄積をゼロに抑え、理論上無限の深さを持つ論理推論を可能にする。 600Bパラメータ規模のモデルを用いた検証では、従来の浮動小数点形式がカオス的な系で崩壊する一方で、本提案手法は無限に精度を維持し、大規模モデルほど数値的に不安定になるという「次元の呪い」を克服した。

5857 字
読む →

低コスト・高効率:マトリョーシカ表現学習を用いたブドウ園におけるLiDAR場所認識

ブドウ園のような非構造的で特徴的な目印が乏しい農業環境において、ロボットが正確に自己位置を特定するための軽量な深層学習手法「MinkUNeXt-VINE」が提案されました。 既存のネットワーク構造を剪定して計算負荷を下げつつ、マトリョーシカ表現学習(MRL)を導入することで、低次元から高次元まで柔軟かつ頑健な記述子を生成し、リアルタイムでの高い処理効率を実現しています。 複数のブドウ園で収集された長期的なデータセットを用いた検証により、季節による外観の変化や低コスト・低解像度なLiDAR入力に対しても、従来の最先端手法を上回る優れた認識精度と汎用性が実証されました。

5765 字
読む →

Gained in Translation: Privileged Pairwise Judges Enhance Multilingual Reasoning

現在の大規模言語モデルは英語以外の言語、特に学習データが少ない低リソース言語において推論能力が著しく低下するという深刻な課題を抱えていますが、本研究は対象言語のデータを一切使わずに英語の翻訳データと強化学習のみで能力を向上させる「SP3F」という革新的な二段階フレームワークを提案しました。

5890 字
読む →

説明可能なブースティングマシンのための統計的推論

本研究は、解釈性の高い「グラスボックス」モデルである説明可能なブースティングマシン(EBM)に、移動平均を用いたブールバード正則化を導入することで、学習プロセスを特徴量ごとのカーネルリッジ回帰へと収束させる理論的枠組みを構築しました。

6291 字
読む →