継続更新

生成AI研究を、要点から追う。

最新の論文記事を読みやすく整理。保存・タグ検索に加え、Plus/Proでは研究ノートと知識グラフで理解を積み上げられます。

無料で試す

Cog AI Archive

最新の記事

ドメイン駆動ソフトウェア設計を強化するための生成AIの活用

ドメイン駆動設計(DDD)におけるメタモデル作成の自動化を目指し、Code Llama 7Bを4ビット量子化とLoRAを用いて、消費者向けGPUという限られた計算資源環境下で微調整した。 実世界のプロジェクトデータを用いた学習により、単純なプロンプトから構文的に正しいJSONオブジェクトを生成することに成功し、設計プロセスの効率化とリソース削減の可能性を示した。 評価指標としてBLEUスコアと損失関数を用い、明確なプロンプトでは100%の構文的正しさを達成したが、トークン制限による繰り返しやデータ分割に起因する構造的課題も確認された。

5768 字
読む →

ソフトウェア工学におけるLLMの包括的なベンチマーク基盤の構築に向けて

現在のコード用大規模言語モデルの評価は、特定のタスクや単純な正解率指標に偏っており、実世界のソフトウェア開発で不可欠な堅牢性、解釈可能性、公平性、効率性といった多角的な側面を十分に評価できていないという課題があります。

6430 字
読む →

情報アクセスがLLMモニターのサボタージュ検出能力に与える影響

LLMエージェントの不正(サボタージュ)を検知する際、思考プロセス(CoT)と行動ログの全情報を与えるよりも、あえて情報を制限した方が検知精度が高まる「Less-is-more」効果が複数の環境で確認されました。

7262 字
読む →

AI生成プルリクエストの品質とレビュアーの感情に関する調査

AIエージェントは人間と比較して既存コードの再利用を軽視する傾向があり、機能は同じでも構文が異なる「意味的な重複(タイプ4クローン)」を約1.87倍も多く生成していることが判明しました。 それにもかかわらず、人間のレビュアーはAIが作成したコードに対して、人間が書いたものよりも中立的または肯定的な感情を抱きやすく、深刻な冗長性や設計上の欠陥を見逃している可能性があります。 この「品質と感情の乖離」は、AIコードが表面上は正しく動作して見えるために警戒心が下がり、長期的には修正困難な「静かな技術的負債」が大規模に蓄積していくリスクを強く示唆しています。

6284 字
読む →

協調学習のための動的フレームワーク:適応型フィードバック機構を備えた高度なLLMの活用

本研究では、高度な大規模言語モデルであるGPT-4oを動的なモデレーターとして統合し、リアルタイムでの議論促進と学習者のニーズへの適応を可能にする新しい協調学習フレームワークを提案しました。検索拡張生成(RAG)技術と多層的なフィードバック機構を組み合わせることで、従来の静的なシステムでは困難だった参加者間の公平な関与の促進や、文脈に応じた柔軟なプロンプト調整を実現しています。FairytaleQAデータセットを用いた検証により、学生のエンゲージメント向上や批判的思考の育成、さらには多様な学習環境におけるスケーラビリティと包括的な教育体験の提供が確認されました。

6090 字
読む →

コンプライアンス・パラドックス:自動コード評価における意味と指示の乖離

大規模言語モデル(LLM)を教育評価に導入する際、指示に従う能力が客観的な判定能力に直結するという前提がありますが、本研究ではモデルがコードの論理を無視して隠された指示を優先する「コンプライアンス・パラドックス」という深刻な脆弱性を明らかにしました。

5713 字
読む →

効率的かつ最適化されたコード生成のためのマルチエージェント協調における適応型信頼ゲート

DebateCoderは、Pangu-1Bのような小規模言語モデル(SLM)が複雑なプログラミングタスクで直面する「推論のボトルネック」や、自身の誤りを修正できずに停滞する「失敗ループ」を打破するために開発された、革新的なマルチエージェント協調フレームワークである。

5953 字
読む →

マルチエージェント連携と適応型信頼ゲートによる効率的かつ最適化されたコード生成

大規模言語モデルが自動コード生成で成果を上げる一方、Pangu-1Bのような小規模言語モデル(SLM)は複雑な論理推論において文脈維持が困難な「推論のボトルネック」や、同じ誤りを繰り返す「失敗ループ」という課題を抱えています。

5769 字
読む →

LLaMEA-SAGE: 説明可能なAIによる構造的フィードバックを用いたアルゴリズム自動設計の誘導

LLaMEA-SAGEは、大規模言語モデル(LLM)を用いたアルゴリズム自動設計において、生成されたコードの抽象構文木(AST)から抽出した構造的特徴量と説明可能なAI(XAI)を組み合わせ、進化の方向性を論理的に誘導する新しいフレームワークである。

6470 字
読む →

LLaMEA-SAGE: 説明可能なAIによる構造的フィードバックを用いた自動アルゴリズム設計の進化

LLaMEA-SAGEは、大規模言語モデル(LLM)を用いた自動アルゴリズム設計において、生成コードの抽象構文木から抽出した構造的特徴を説明可能AI(XAI)で解析し、性能向上に繋がる具体的な修正指針を自然言語でフィードバックする新しいフレームワークである。

5965 字
読む →