粒子からエージェントへ:空間シミュレーションにおける認知的摩擦の指標としてのハルシネーション
TL;DR従来の建築シミュレーションは要素を物理的な「粒子」として扱ってきましたが、本研究では大規模マルチモーダルモデルを用いた「エージェンティック環境シミュレーション」を提案します。AIのハルシネーションを診断ツールとして利用し、空間内の意味的な曖昧さ(ファントム・アフォーダンス)を検出する枠組みを提示しています。
Cog AI Archive
TL;DRRedSageは、プライバシーリスクを回避しつつ多様なセキュリティ業務を支援するために開発された、オープンソースのサイバーセキュリティ特化型LLMである。118億トークンの専門データによる事前学習と、エージェントベースのパイプラインで生成された26.6万件の指示データによる調整を経て、既存モデルを上回る性能を実現した。
TL;DR従来の建築シミュレーションは要素を物理的な「粒子」として扱ってきましたが、本研究では大規模マルチモーダルモデルを用いた「エージェンティック環境シミュレーション」を提案します。AIのハルシネーションを診断ツールとして利用し、空間内の意味的な曖昧さ(ファントム・アフォーダンス)を検出する枠組みを提示しています。
TL;DR本研究は、生成AIと誤情報に関する2024年の調査以降の脅威の変化を報告し、文献レビューから実践的な対策へと焦点を移行させています。AI生成ニュースに対する人間の認識を評価する「JudgeGPT」と、研究用の刺激生成エンジン「RogueGPT」を開発し、実験パイプラインを構築しました。
TL;DR大規模基盤モデル(LFM)の敵対的な操作に対する脆弱性を克服するため、有害な意味論の伝播回路を追跡・切断する「TraceRouter」が提案された。従来の局所的な介入とは異なり、注意の分岐分析、スパースオートエンコーダ、因果経路のマッピングを組み合わせることで、有害な情報の流れを物理的に遮断しつつ、一般的な有用性を維持することに成功している。
TL;DR大規模言語モデル(LLM)の推論能力向上に有効な「テスト時計算量」の増加は、クラウドプロバイダーの利益を優先し、ユーザーコストを増大させる社会的非効率を生んでいる。本研究はこの問題を解決するため、プロバイダーが入札を行う逆第二価格オークションメカニズムを提案し、LlamaやQwenなどを用いた実験でその有効性を検証した。
TL;DR本論文は、未成年者や個人データを含む教育現場の敏感さを踏まえ、知的教育における「信頼性」を体系的に整理した調査報告である。学習者の能力評価や推薦などの5つのタスクと、安全性や公平性などの5つの信頼性視点を交差させ、既存研究の手法を分類・要約している。
TL;DRYouTubeの主要ニュースチャンネルにおいて、道徳的な怒りを煽る表現が視聴者の行動にどう影響するかを、韓国と米国で調査した研究である。サムネイルとタイトルを組み合わせたマルチモーダル分類器を開発し、約40万本の動画を分析した結果、他者を道徳的に非難する表現は、単なる視聴だけでなく「いいね」
TL;DRアラビア語の語彙と定義を紐付けた大規模データセット「MURAD」が公開されました。信頼できる出典から抽出された96,243組の単語と定義のペアを含み、言語学やイスラム研究、科学、工学など幅広い分野を網羅しています。逆引き辞書の構築や意味検索、教育ツールの開発など、アラビア語の自然言語処理研究を促進するリソースです。
TL;DRMURADは、96,243組の単語と定義のペアを含む、アラビア語の大規模な公開語彙データセットです。信頼できる参考文献や教育資料から、言語学、イスラム研究、数学、工学など多岐にわたる分野の用語を収集しています。逆引き辞書の構築や意味検索、教育ツールの開発を支援し、アラビア語の自然言語処理の発展を目指しています。
TL;DR報酬モデルは事前学習から価値バイアスを継承する arXiv 要約 背景。 技術要点 インパクト。 限界 次の一手 --- 論文情報 - URL: http://arxiv.org/abs/2601.20838v1。
TL;DR構造的障壁としての管轄権:プライバシーポリシーの構成が実質的開示の可視性を低下させる可能性 arXiv 要約 背景。 技術要点 インパクト。 限界 次の一手 --- 論文情報 - URL: http://arxiv.org/abs/2601.20792v1。
Pricing