継続更新

生成AI研究を、要点から追う。

最新の論文記事を読みやすく整理。保存・タグ検索に加え、Plus/Proでは研究ノートと知識グラフで理解を積み上げられます。

無料で試す

Cog AI Archive

最新の記事

MeanCache: Flow Matching推論を加速するための、瞬時速度から平均速度へ

Flow Matchingを用いた生成モデルにおいて、従来のキャッシュ手法が依存していた「瞬間速度」の情報は変動が激しく、高い加速率では軌道の逸脱や誤差の蓄積を招くという課題がありました。本研究が提案する「MeanCache」は、瞬間速度を「区間平均速度」へと変換し、キャッシュされたヤコビアン・ベクトル積(JVP)を用いて軌道を補正することで、学習不要かつ軽量な形で生成品質を維持しながら推論を大幅に高速化します。FLUX.1やHunyuanVideoなどの商用規模モデルを用いた検証では、最大で4.56倍の高速化を達成し、既存の最先端手法と比較しても高い画像・動画品質と構造的一貫性を保持できることが実証されました。

5636 字
読む →

CHEHAB RL:完全準同型暗号計算の最適化の学習

完全準同型暗号(FHE)は暗号化されたまま計算が可能ですが、計算コストが極めて高く、効率的なコード作成には専門知識と複雑な最適化が必要という課題があります。 本研究が提案する「CHEHAB RL」は、深層強化学習(RL)を活用して、スカラーコードの自動ベクトル化や命令レイテンシおよびノイズ増加を抑制する書き換えルールの適用を自動化するフレームワークです。 最新のコンパイラであるCoyoteと比較して、実行速度で5.3倍、ノイズ蓄積量で2.54倍の改善を達成し、コンパイル時間自体も27.9倍高速化することに成功しました。

6028 字
読む →

DSP-Reg:ロバストなドメイン汎化のためのドメイン考慮型パラメータ正則化

機械学習のドメイン汎化において、従来の特徴量レベルの不変性学習では不十分であったモデル内部のパラメータごとの感度差に着目し、ドメインシフトに対する脆弱性を定量化する新しい理論的枠組みを構築した。

5916 字
読む →

RPO:部分的推論最適化を用いた強化学習ファインチューニング

大規模言語モデルの強化学習において、推論の全行程を毎回ゼロから生成する非効率性を解消するため、過去の正解パスの接頭辞を再利用して末尾のみを生成・最適化する「RPO(部分的推論最適化)」が提案されました。 この手法は、キャッシュされた成功例をヒントとして活用することで、トレーニング中のトークン生成量を約95%削減し、1.

5734 字
読む →

不整合な動作事前知識からのタスク中心の方策最適化

ヒューマノイドロボットの制御において、人間の動作データを模倣する手法は自然な動きを実現する一方で、ロボットの身体構造との違いやタスクとの不整合により、単純な模倣がタスク性能を著しく低下させるという深刻な課題がありました。

7245 字
読む →

OSIRIS: スケーラブルなデータセット生成によるアナログ回路設計と機械学習の橋渡し

アナログ集積回路(IC)のレイアウト設計は、物理的な配置や寄生効果、回路性能の複雑な相互依存関係により、依然として手動作業が中心の困難な課題となっています。本研究では、アナログIC設計のためのスケーラブルなデータセット生成パイプラインである「OSIRIS」を提案し、設計空間を体系的に探索して包括的な性能指標とメタデータを生成する手法を確立しました。このフレームワークを用いて生成された87,100個の回路バリエーションを含むデータセットを公開し、強化学習を用いたレイアウト最適化や大規模言語モデルの微調整による自動生成の可能性を実証しています。

6556 字
読む →

APC-RL: 適応的な方策合成でデータ駆動型の事前分布を超える強化学習手法

従来の強化学習におけるデモンストレーションの活用は、データが最適かつタスクに完全に適合していることを前提としていたが、現実の不完全なデータでは性能が低下するという課題があった。 本研究が提案するAPC(Adaptive Policy Composition)は、複数の正規化流を用いた事前分布を持つアクターと、事前分布を一切持たないアクターを階層的に組み合わせ、オンラインの報酬に基づいて適切な行動を適応的に選択する。 実験の結果、APCはデモンストレーションが不適合な場合でも堅牢性を維持し、適合している場合には学習を大幅に加速させ、さらに不完全なデータからでも最適な行動を導き出すことが確認された。

6056 字
読む →

時相論理を通じた状態空間モデルの表現能力について

状態空間モデル(SSM)の表現能力は、採用されるゲート機構の構造と計算に使用される数値の精度に深く依存しており、特に対角ゲート型SSMは固定精度において過去時相論理(PLTLf)で定義可能なスターフリー言語を認識する能力を持つことが証明されました。

6744 字
読む →

タスク条件付き潜在アライメントによる神経スパイクデータのセッション間デコーディング

侵襲的脳コンピュータインターフェースにおいて、記録セッション間の神経信号の非定常性はデコーダの精度を低下させる大きな課題であり、新しいセッションごとに大量の再学習データを収集することはユーザーの負担となっていた。

6197 字
読む →

GenCP:連成物理の生成モデリングパラダイムに向けて

本研究は、複数の物理現象が相互に影響し合う複雑な連成物理システムのシミュレーションにおいて、個別に分離されたデータのみで学習を行い、推論時に結合状態を生成できる革新的な生成パラダイム「GenCP」を提案した。

6556 字
読む →