継続更新

生成AI研究を、要点から追う。

最新の論文記事を読みやすく整理。保存・タグ検索に加え、Plus/Proでは研究ノートと知識グラフで理解を積み上げられます。

無料で試す

Cog AI Archive

最新の記事

出力空間探索:フリーズされたエンコーダによって定義された出力空間におけるLLM生成の標的化

大規模言語モデル(LLM)の生成を、従来の「トークンの逐次的な選択」から、3次元の出力空間(Z空間)における「終点の探索」へと転換する手法「OS-Search」を提案した。 固定されたエンコーダと強化学習(RL)を用いて、指定された座標(z*)の近傍に着地する出力を生成するポリシーを構築し、並列的な多様性探索やブラックボックス最適化を可能にした。 物語生成では従来のプロンプトチェイニングより3.1倍高い多様性を実現し、コード生成では外部評価指標を最大化する最適化に成功するなど、高い制御性と実用性が示された。

5952 字
読む →

簡潔な幾何学的記述を架け橋に:平面幾何学問題解決におけるLLMの潜在能力の解放

平面幾何学の問題解決において、マルチモーダルモデルが抱える視覚的な認識誤りや論理推論能力の低下を克服するため、図形を簡潔な幾何学的記述言語(CDL)へ変換する「インタープリター」と、その記述を基に解答を導く「ソルバー」を分離した二段階のフレームワークを提案しています。

5670 字
読む →

出力空間探索:凍結されたエンコーダによって定義された出力空間におけるLLM生成の標的化

本研究は、大規模言語モデル(LLM)の生成を、トークンの逐次選択から3次元の出力空間(Z空間)における終点探索へと転換する「OS-Search」を提案した。 凍結されたエンコーダと強化学習(GRPO)を組み合わせることで、指定された座標ターゲット($z^*$)に基づき、目標地点に近い出力を直接生成する制御を可能にした。

6707 字
読む →

出力空間探索:凍結されたエンコーダによって定義された出力空間におけるLLM生成の標的化

OS-Searchは、LLMの生成プロセスを従来のトークン単位の探索から、固定されたエンコーダが定義する3次元の出力空間(Z空間)における終点探索へと転換する革新的な手法である。 外部ループがターゲット座標を選択し、強化学習で訓練されたポリシーがその近傍に着地する出力を生成することで、パス依存のない並列スイープやブラックボックス最適化を可能にする。 物語生成では従来のプロンプトチェイニングと比較して3.1倍の多様性を実現し、コード生成ではベイズ最適化を用いることで、モデルが学習時に知らなかった外部評価指標のスコアを向上させることに成功した。

6150 字
読む →

AC2L-GAD: 能動的反事実対照学習によるグラフ異常検知

グラフ異常検知におけるラベル不足と深刻なクラス不均衡という二つの根本的な課題を解決するため、能動学習と反事実推論を統合した革新的なフレームワーク「AC2L-GAD」が提案されました。 従来の手法が抱えていた「ランダムなデータ拡張による意味的一貫性の崩壊」と「単純な負例による学習効率の低下」という致命的な欠陥に対し、異常性を維持する正例と正常化された硬い負例を生成することで、モデルの識別能力を飛躍的に向上させています。 情報理論に基づき学習に最も寄与するノードを戦略的に選択して反事実生成を行うことで、計算コストを約65%削減しつつ、金融不正検知を含む9つのベンチマークで既存の18手法を上回る性能を実証しました。

6092 字
読む →

AC2L-GAD:グラフ異常検知のための能動的反事実的対照学習

グラフ異常検知における「ラベル不足」と「極端なクラス不均衡」という二大課題を解決するため、能動学習と反事実的推論を統合した新フレームワーク「AC2L-GAD」が提案されました。 従来の対照学習が抱えていた、ランダムなデータ拡張による意味的一貫性の喪失(Gap G1)と、単純な負例サンプリングによる識別能力の停滞(Gap G2)という根本的な欠陥を、情報理論に基づく戦略的なノード選択と、異常の性質を精密に制御する反事実的なデータ生成によって克服しています。 9つのベンチマークを用いた実験では、18の主要な既存手法を上回る検知精度を達成しながら、計算コストを約65%削減することに成功しており、大規模ネットワークにおける実用性と高精度な識別能力を極めて高いレベルで両立させています。

6500 字
読む →

エンティティ・アライメント基盤モデルにおける推論の地平を突破する

1. 従来のエンティティ・アライメント(EA)手法は未知の知識グラフに対して再学習が必要であり、既存のグラフ基盤モデルを適用しても、二つのグラフを跨ぐ際の「推論ホライゾン・ギャップ(推論の地平の乖離)」により精度が著しく低下するという課題があった。 2.

6531 字
読む →

エンティティ・アライメント基盤モデルにおける推論の地平を突破する

エンティティ・アライメント(EA)は知識グラフ統合の要であるが、既存手法は学習時のデータに依存するトランスダクティブな性質を持つため、未知のグラフに対して再学習なしで適用できないという転移性の欠如が長年の課題であった。

5776 字
読む →

MAD: マルチモーダルLLMにおけるクロスモーダル・ハルシネーションを軽減するモダリティ適応型デコーディング

マルチモーダル大規模言語モデル(MLLM)において、あるモダリティの情報が別のモダリティの生成を不適切に歪めてしまう「クロスモーダル・ハルシネーション」を解決するため、追加学習を必要としない新しいデコーディング手法「MAD(Modality-Adaptive Decoding)」が提案された。

6468 字
読む →

MAD: マルチモーダル大規模言語モデルにおけるクロスモーダル・ハルシネーション抑制のためのモダリティ適応型デコーディング

マルチモーダル大規模言語モデルにおいて、映像や音声といった異なる感覚情報が互いに干渉し合い、入力データに存在しない情報を捏造してしまう「クロスモーダル・ハルシネーション」という深刻な課題を解決するための新しい推論手法である。

5827 字
読む →