継続更新

生成AI研究を、要点から追う。

最新の論文記事を読みやすく整理。保存・タグ検索に加え、Plus/Proでは研究ノートと知識グラフで理解を積み上げられます。

無料で試す

Cog AI Archive

最新の記事

イグボ語の発音記号復元に対するコーパスベースのアプローチ

イグボ語は自然言語処理のリソースが極めて乏しい言語であり、デジタルテキストにおいて意味や声を区別する発音記号が省略されることで生じる深刻な曖昧性が、言語理解の大きな障壁となっている。本研究では、この問題を解決するために、n-gramモデル、機械学習による分類モデル、および他言語からの投影を利用した単語埋め込みモデルという3つの主要な技術的アプローチを提案し、データセット生成のための柔軟なフレームワークを構築した。検証の結果、提案されたすべての手法が単語の出現頻度のみに基づく基準値を大幅に上回る精度を記録し、特に文脈情報を活用する手法が、検索エンジンや機械翻訳などの言語インフラを改善する上で極めて有効であることを実証した。

6243 字
読む →

FastInsight: グラフRAGのための融合演算子による高速かつ洞察に満ちた検索

従来のグラフRAG手法は、大規模言語モデル(LLM)による推論プロセスを検索の合間に挟み込むことで洞察を得ていたが、このアプローチは実行に数十秒を要するなど極めて低速であり、実用的な対話システムへの導入が困難であった。

6160 字
読む →

Pの捕捉:ブール検索の表現能力と効率的な評価について

現代の情報検索は、単純なキーワード検索から大規模言語モデル(LLM)や自律型エージェントが要求する複雑な記号論理的推論へと移行していますが、既存の検索エンジンは複雑な論理構造を効率的に処理できないという深刻な課題を抱えています。

6010 字
読む →

Dep-Search:永続メモリを用いた依存関係を考慮した推論トレースの学習

大規模言語モデルを用いた従来の検索型フレームワークは、自然言語による暗黙的な推論に依存しており、サブ質問間の依存関係の管理や過去に取得した知識の効率的な再利用が困難であるという課題を抱えていました。

5654 字
読む →

XProvence:検索拡張生成のためのゼロコストな多言語コンテキストプルーニング

XProvenceは、検索拡張生成(RAG)の推論速度を向上させるため、リランカーに「ゼロコスト」でコンテキスト削減機能を統合した多言語対応モデルであり、BGE-M3を基盤として100以上の言語をサポートします。

6897 字
読む →

RobustExplain:推薦のためのLLMベース説明エージェントの堅牢性評価

大規模言語モデル(LLM)を推薦理由の説明に活用する際、誤クリックやデータの欠損といった現実的なノイズが説明の整合性に与える影響を評価する初のフレームワーク「RobustExplain」が開発されました。 5種類の行動ノイズと4つの評価指標を用いて実験した結果、現在のLLMの堅牢性は平均0.

5666 字
読む →

Talos:推薦システムにおけるTop-$K$精度の最適化

従来の推薦システムで主流だった全ランキング指標の最適化は、実際の利用シーンで重要なTop-$K$精度と必ずしも一致しないという課題がありました。本研究で提案されたTalosは、複雑な順位計算をスコアとしきい値の比較に置き換えるクォンタイル手法を導入し、Top-$K$精度を直接的かつ効率的に最適化する新しい損失関数です。

6026 字
読む →

きめ細かな知識エンティティと多面的な文書埋め込みを用いた学術論文推薦の強化

学術文献の爆発的な増加に伴い、研究者が自身のニーズに合致する論文を正確に見つける負担が増大している。従来の推薦システムは広範なトピックの類似性に依存しており、特定の研究手法やタスクといった詳細なニーズに応えることが困難であった。

6471 字
読む →

中間を見よ:スケーラブルなVisual RAGインデクシングのための構造的アンカープルーニング

Visual RAGの普及を阻む最大の課題であるインデックスサイズの巨大化に対し、追加学習を一切必要とせず、検索精度を維持したままベクトル量を90%以上削減する画期的なプルーニング手法「Structural Anchor Pruning(SAP)」を提案した。

6591 字
読む →

検索システムフレームワークの分類学:その落とし穴とパラダイム

本論文は、埋め込みベースの検索システムにおける効率性と有効性のトレードオフを整理するため、「表現層」「粒度層」「オーケストレーション層」「堅牢性層」の4層からなる新しい分類学を提案している。 Bi-Encoderの高速性とCross-Encoderの高精度を両立させるLate Interactionなどのハイブリッド手法や、ドキュメント分割(チャンキング)が検索精度と生成品質に与える影響を詳細に分析し、システム全体の最適化指針を示している。 さらに、ドメイン一般化の失敗や語彙の死角、時間の経過による情報の陳腐化(時間的ドリフト)といった実運用上の課題を体系化し、タイムスタンプ注入などの具体的なアーキテクチャ上の緩和策を提示している。

6110 字
読む →