Cog AI Archive

最新の記事

公開記事: 740件

RedSage: サイバーセキュリティに特化した汎用LLM

TL;DRRedSageは、プライバシーリスクを回避しつつ多様なセキュリティ業務を支援するために開発された、オープンソースのサイバーセキュリティ特化型LLMである。118億トークンの専門データによる事前学習と、エージェントベースのパイプラインで生成された26.6万件の指示データによる調整を経て、既存モデルを上回る性能を実現した。

AI研究 2026-01-29 閲覧 11 クリック 5

最新人気保存済み長文のみ

AI研究 2026-01-29

SWE-Replay: ソフトウェアエンジニアリングエージェントのための効率的なテスト時スケーリング

TL;DRSWE-Replayは、ソフトウェアエンジニアリングタスクにおけるLLMエージェントのテスト時スケーリングを効率化する新しい手法である。過去の試行の軌跡を再利用し、重要な中間ステップで分岐することで、ゼロからの探索と過去の経験の活用を動的に切り替える。これにより、コストを最大17.

読了 0 分 1480 字

読む →

AI研究 2026-01-29

ハミルトニアンフローマップの学習：大規模タイムステップ分子動力学のための平均流整合性

TL;DRハミルトニアン系の長時間シミュレーションにおける小さなタイムステップの制約を克服するため、ハミルトニアンフローマップを学習する枠組みを提案する。時間平均されたハミルトニアンダイナミクスに対する平均流整合性条件を導入することで、従来の積分器の限界を大きく超える安定した大規模タイムステップ更新を実現した。

読了 0 分 1258 字

読む →

AI研究 2026-01-29

SINA: AIを用いた回路図画像からネットリストへの自動生成ツール

TL;DR回路図画像を機械可読なネットリストへ変換する際、部品認識や接続推論に課題があった。本研究では、深層学習による部品検出、CCLによる接続抽出、OCRとVLMを組み合わせた参照指定子の割り当てを統合したオープンソースツール「SINA」を提案する。実験では、既存の最先端手法の2.72倍となる96.47%の全体精度を達成した。

読了 0 分 1206 字

読む →

AI研究 2026-01-29

物理法則に基づく4次元大気風速場の再構成：マルチドローン群観測を活用して

TL;DR本研究は、複数のドローン（UAS）群の観測データを用いて、4次元の大気風速場を再構成するフレームワークを提案しています。双方向LSTMで局所的な風を推定し、物理法則に基づくニューラルネットワーク（PINN）で時空間的に連続な風速場を復元します。専用センサーなしで高精度な風速場の再構成が可能であることを示しました。

読了 0 分 1406 字

読む →

AI研究 2026-01-29

下流タスクのフィードバックを用いた価値ベースの事前学習

TL;DR少量の検証済み目標情報を用いて、基盤モデルの事前学習を制御する「V-Pretraining」という手法が提案された。この手法は、下流タスクの勾配と整合するように事前学習タスク（データ拡張など）を選択し、計算リソースを効率的に配分する。言語モデルや画像処理において、推論能力や精度の向上が確認された。

読了 0 分 1234 字

読む →

AI研究 2026-01-29

ECO: フル精度マスターウェイト不要の量子化トレーニング

TL;DR大規模言語モデル（LLM）の学習において、高精度のマスターウェイトを保持する必要性を排除する新しい最適化手法「ECO」が提案された。ECOは量子化されたパラメータに直接更新を適用し、量子化誤差をオプティマイザのモーメンタムに注入することで補正する。

読了 0 分 1441 字

読む →

AI研究 2026-01-29

分位点勾配によるCVaR方策最適化のブースティング

TL;DR条件付きバリュー・アット・リスク（CVaR）の方策勾配法は、テールの性能に焦点を当てるためサンプル効率が悪いという課題がある。本研究では、CVaRに期待分位点項を追加することで、すべてのサンプリングデータを利用可能な動的計画法を導入し、サンプル効率を改善する手法を提案する。

読了 0 分 1155 字

読む →

AI研究 2026-01-29

オフライン好みの最適化のための潜在空間における敵対的正則化

TL;DR従来の言語モデルの学習ではトークン単位の正則化が主流でしたが、意味的な類似性を捉えきれない課題がありました。本研究は、モデル内部の潜在表現の乖離を抑える手法「GANPO」を提案します。GANの手法を応用して潜在空間での正則化を行うことで、ノイズや分布の変化に強く、より頑健な学習が可能になることを示しました。

読了 0 分 1180 字

読む →

AI研究 2026-01-29

生成AIの推論エネルギー消費を解剖する：大規模測定と診断フレームワーク

TL;DR生成AIにおける推論時のエネルギー消費を最適化するため、46モデル・7タスク・1,858構成に及ぶ大規模な測定を実施した研究である。タスクの種類やGPU使用率の違いがエネルギー消費に数倍から百倍以上の差を生むことを明らかにし、その要因を分析するためのフレームワークを提案している。

読了 0 分 1287 字

読む →

AI研究 2026-01-29

VTC-R1: 長文脈推論を効率化する視覚・テキスト圧縮技術

TL;DRVTC-R1は、長文脈推論の計算コストを削減する新しい手法である。中間の推論過程をテキストではなく画像としてレンダリングし、「視覚的メモリ」としてモデルに再入力することで、トークン数を約3.4倍圧縮する。これにより、MATH500などのベンチマークで性能を向上させつつ、推論速度を2.7倍高速化した。

読了 0 分 1239 字

読む →

保存済みの記事がまだありません。

読み込み中…

前へ次へ

生成AIの最新動向を、読みやすいアーカイブで。

RedSage: サイバーセキュリティに特化した汎用LLM

最新の記事

RedSage: サイバーセキュリティに特化した汎用LLM

SWE-Replay: ソフトウェアエンジニアリングエージェントのための効率的なテスト時スケーリング

ハミルトニアンフローマップの学習：大規模タイムステップ分子動力学のための平均流整合性

SINA: AIを用いた回路図画像からネットリストへの自動生成ツール

物理法則に基づく4次元大気風速場の再構成：マルチドローン群観測を活用して

下流タスクのフィードバックを用いた価値ベースの事前学習

ECO: フル精度マスターウェイト不要の量子化トレーニング

分位点勾配によるCVaR方策最適化のブースティング

オフライン好みの最適化のための潜在空間における敵対的正則化

生成AIの推論エネルギー消費を解剖する：大規模測定と診断フレームワーク

VTC-R1: 長文脈推論を効率化する視覚・テキスト圧縮技術

論文×チャット×知識DBを続けるなら

Free

Plus

Pro