継続更新

生成AI研究を、要点から追う。

最新の論文記事を読みやすく整理。保存・タグ検索に加え、Plus/Proでは研究ノートと知識グラフで理解を積み上げられます。

無料で試す

Cog AI Archive

最新の記事

大型言語モデルの制御におけるスタイルベクトルの有効性:人間による評価

大型言語モデルの内部活性化を直接操作するアクティベーション・ステアリングは、追加学習や複雑なプロンプトを必要とせずに、出力の感情トーンを精密かつ段階的に制御できる軽量な手法である。本研究では、190人の参加者から7,000件以上の評価を収集する初の大規模な人間評価を実施し、人間がモデルの感情変化を明確に知覚できること、および自動評価指標と人間の直感が平均r=0.776という高い相関を示すことを証明した。特定の強度(λ≈0.15)でステアリングを行うことで、テキストの読みやすさを維持したまま「嫌悪」や「恐怖」などの感情を効果的に増幅できる一方、「驚き」の制御は比較的困難であるという感情ごとの特性や、モデルの基礎能力が制御の一貫性に寄与することが明らかになった。

5808 字
読む →

LLMの感情制御におけるスタイルベクトルの有効性:人間による評価

本研究は、大規模言語モデル(LLM)の内部活性化を直接操作する「アクティベーション・ステアリング」を用い、出力の感情トーンを制御する手法の有効性を、190人の参加者による7,000件以上の評価を通じて初めて人間中心の視点から検証した。 実験の結果、ステアリング強度を適切な値($\lambda \approx 0.

5806 字
読む →

LLaMEA-SAGE: 説明可能なAIによる構造的フィードバックを用いたアルゴリズム自動設計の誘導

LLaMEA-SAGEは、大規模言語モデル(LLM)を用いたアルゴリズム自動設計において、生成されたコードの抽象構文木(AST)から抽出した構造的特徴量と説明可能なAI(XAI)を組み合わせ、進化の方向性を論理的に誘導する新しいフレームワークである。

6470 字
読む →

LLaMEA-SAGE: 説明可能なAIによる構造的フィードバックを用いた自動アルゴリズム設計の進化

LLaMEA-SAGEは、大規模言語モデル(LLM)を用いた自動アルゴリズム設計において、生成コードの抽象構文木から抽出した構造的特徴を説明可能AI(XAI)で解析し、性能向上に繋がる具体的な修正指針を自然言語でフィードバックする新しいフレームワークである。

5965 字
読む →

費用対効果の向上:Reset and Discard (ReD) を用いた固定予算における大規模言語モデルの推論の向上

大規模言語モデル(LLM)の性能評価を、従来の1問あたりの成功率(pass@k)から、限られた総予算内で解決できるユニークな問題数(coverage@cost)へと転換することを提案しています。

5922 字
読む →

費用対効果の向上:Reset and Discard (ReD) を用いた固定予算下での大規模言語モデルの推論の改善

大規模言語モデル(LLM)の推論において、従来は1回でも正解する確率を示すpass@kが重視されてきましたが、実運用では限られた予算内でいくつの異なる問題を解決できるかというcoverage@costがより重要な指標となります。

5749 字
読む →

KAPSO: 知識に基づいた自律的なプログラム合成と最適化のためのフレームワーク

KAPSOは、自然言語の目標と評価方法を入力として、プログラムの着想、合成、実行、評価、学習のサイクルを自律的に繰り返すモジュール式のフレームワークであり、プログラム合成を単なるコード生成の終着点ではなく、測定可能な目標に向けた継続的な最適化プロセスとして再定義している。

6023 字
読む →

KAPSO:自律的なプログラム合成と最適化のための知識に基づいたフレームワーク

KAPSOは、自然言語の目標と評価方法を入力として、アイデア生成、コード合成、実行、評価、学習を繰り返すことで、測定可能な目標に向けて成果物を自律的に改善し続けるモジュール型フレームワークである。

6590 字
読む →

人工知能時代における持続可能な材料探索

現在のAI駆動型材料探索は、材料の性能や安定性の最適化を最優先する「性能第一主義」に偏っており、環境負荷の評価が合成後の最終段階まで先送りにされているため、持続不可能な技術に多大な資源が投じられるという重大な非効率性が生じている。

5731 字
読む →

人工知能時代における持続可能な材料探索

現在のAI駆動型材料探索は性能の最適化を優先し、持続可能性の評価を合成後まで後回しにしているため、環境負荷が判明した時点ではすでに持続不可能な解決策に資源が投じられているという非効率性が生じている。

6151 字
読む →