論文検索 新着 人気 料金
運営: Cognitive Research Labs(CRL) crl.co.jp
毎日更新
AI DATA BASE

生成AI研究を、要点から追う。

最新の論文記事を読みやすく整理。カテゴリとタグで横断して探せます。

運営: Cognitive Research Labs(CRL)

新着 論文 人気 料金 無料で試す
Popular

RedSage: サイバーセキュリティに特化した汎用LLM

TL;DRRedSageは、プライバシーリスクを回避しつつ多様なセキュリティ業務を支援するために開発された、オープンソースのサイバーセキュリティ特化型LLMである。118億トークンの専門データによる事前学習と、エージェントベースのパイプラインで生成された26.6万件の指示データによる調整を経て、既存モデルを上回る性能を実現した。

Cog AI Archive

最新の記事

人気記事ピックアップ

RedSage: サイバーセキュリティに特化した汎用LLM

TL;DRRedSageは、プライバシーリスクを回避しつつ多様なセキュリティ業務を支援するために開発された、オープンソースのサイバーセキュリティ特化型LLMである。118億トークンの専門データによる事前学習と、エージェントベースのパイプラインで生成された26.6万件の指示データによる調整を経て、既存モデルを上回る性能を実現した。

AI研究 2026-01-29 閲覧 41 クリック 17

inversedMixup: 混合埋め込みの反転によるデータ拡張

inversedMixupは、Mixupの制御性とLLM生成の解釈性を両立した新しいデータ拡張手法です。タスク固有モデルとLLMの埋め込み空間を整列させることで、混合された埋め込みを人間が理解可能な自然言語へと再構成します。

読了 0 分 1152 字
読む →

inversedMixup: 混合埋め込みの反転によるデータ拡張

inversedMixupは、Mixupの制御性とLLM生成の解釈性を両立した新しいデータ拡張手法です。タスク固有モデルの埋め込み空間をLLMの入力空間と整列させることで、混合された埋め込みを人間が理解可能な自然言語へと再構成します。テキストMixupにおける多様体侵入現象を実証し、その緩和策も提案しています。

読了 0 分 1256 字
読む →

KAPSO: 知識に基づいた自律的なプログラム合成と最適化のためのフレームワーク

KAPSOは、自然言語の目標からプログラムを自律的に合成・最適化するモジュール型フレームワークです。Gitベースの実験管理、多様な外部知識の統合、過去の試行から学ぶ認知メモリ層を組み合わせることで、長期的なタスクにおける失敗を抑制します。

読了 0 分 1267 字
読む →

KAPSO: 知識に基づいた自律的プログラム合成と最適化のためのフレームワーク

KAPSOは、自然言語の目標からプログラムを自律的に合成・最適化するモジュール型フレームワークです。Gitベースの実験エンジン、多様な情報源を統合する知識システム、過去の試行から学習する認知メモリ層を組み合わせ、長期的な最適化ループを実現します。MLE-Bench等のベンチマークでその性能が評価されています。

読了 0 分 1018 字
読む →

LMK > CLS:密な埋め込みのためのランドマークプーリング

本研究は、従来の[CLS]トークンや平均プーリングに代わる、新しいプーリング手法「ランドマーク(LMK)プーリング」を提案します。シーケンスをチャンクに分割し、挿入したランドマークトークンの埋め込みを平均化することで、情報の偏りや希釈を防ぎます。

読了 0 分 1227 字
読む →

LMK > CLS: 高密度埋め込みのためのランドマークプーリング

本研究は、従来の[CLS]や平均プーリングの弱点を克服する「ランドマーク(LMK)プーリング」を提案します。文章をチャンクに分割し、挿入した特殊トークンの埋め込みを平均化することで、局所的な特徴を維持しつつ長文の文脈理解を向上させます。

読了 0 分 1276 字
読む →

MURAD: 大規模な多領域統合型アラビア語逆引き辞書データセット

アラビア語の語彙と定義を紐付けた大規模データセット「MURAD」が公開されました。信頼できる出典から抽出された96,243組の単語と定義のペアを含み、言語学やイスラム研究、科学、工学など幅広い分野を網羅しています。逆引き辞書の構築や意味検索、教育ツールの開発など、アラビア語の自然言語処理研究を促進するリソースです。

読了 0 分 1206 字
読む →

MURAD:大規模かつ多領域を統合したアラビア語逆引き辞書データセット

MURADは、96,243組の単語と定義のペアを含む、アラビア語の大規模な公開語彙データセットです。信頼できる参考文献や教育資料から、言語学、イスラム研究、数学、工学など多岐にわたる分野の用語を収集しています。逆引き辞書の構築や意味検索、教育ツールの開発を支援し、アラビア語の自然言語処理の発展を目指しています。

読了 0 分 1180 字
読む →

大型言語モデルの制御におけるスタイルベクトルの有効性:人間による評価

本研究は、LLMの内部活性化を直接修正して出力を制御する「活性化ステアリング」の有効性を、人間による評価を通じて検証しました。7,000件以上の評価データを分析した結果、適切な強度での制御がテキストの品質を保ちつつ感情を増幅できることが判明しました。特に嫌悪や恐怖の感情で高い効果が確認されています。

読了 0 分 1233 字
読む →

LLMの感情制御におけるスタイルベクトルの有効性:人間による評価

本研究は、LLMの内部活性化を調整して出力を制御する「アクティベーション・ステアリング」の有効性を、人間による評価を通じて検証しました。7,000件以上の評価データを分析した結果、適度な強度での制御が品質を保ちつつ感情を増幅できることが判明しました。特に嫌悪や恐怖の感情制御で高い効果が確認されています。

読了 0 分 1318 字
読む →
保存済みの記事がまだありません。
読み込み中…

Pricing

論文×チャット×知識DBを続けるなら

Free

¥0
  • 要約閲覧
  • 全文は月 2 本まで
  • チャットは月 3 回まで
無料で始める

Plus

¥1,780 / 月
  • 全文閲覧無制限
  • スレッド保存
  • Flashモデル
  • チャット上限 300 回/月
Plusで始める

Pro

¥2,980 / 月
  • 全文閲覧無制限
  • スレッド保存
  • 長文回答(Proモデル)
  • チャット上限 800 回/月
Proで始める