TraceRouter: 大規模基盤モデルのための経路レベル介入による堅牢な安全性
TL;DR大規模基盤モデル(LFM)の敵対的な操作に対する脆弱性を克服するため、有害な意味論の伝播回路を追跡・切断する「TraceRouter」が提案された。従来の局所的な介入とは異なり、注意の分岐分析、スパースオートエンコーダ、因果経路のマッピングを組み合わせることで、有害な情報の流れを物理的に遮断しつつ、一般的な有用性を維持することに成功している。
Cog AI Archive
TL;DRRedSageは、プライバシーリスクを回避しつつ多様なセキュリティ業務を支援するために開発された、オープンソースのサイバーセキュリティ特化型LLMである。118億トークンの専門データによる事前学習と、エージェントベースのパイプラインで生成された26.6万件の指示データによる調整を経て、既存モデルを上回る性能を実現した。
TL;DR大規模基盤モデル(LFM)の敵対的な操作に対する脆弱性を克服するため、有害な意味論の伝播回路を追跡・切断する「TraceRouter」が提案された。従来の局所的な介入とは異なり、注意の分岐分析、スパースオートエンコーダ、因果経路のマッピングを組み合わせることで、有害な情報の流れを物理的に遮断しつつ、一般的な有用性を維持することに成功している。
TL;DR肥満や糖尿病などの食事関連疾患の増加に伴い、正確な食事摂取量の把握が求められています。本研究では、単眼画像から実寸大(true-to-scale)の3Dモデルを再構築し、食事量を正確に推定する新手法を提案します。大規模データセットで学習した特徴を活用してスケールを推定し、既存手法と比較して体積推定誤差を約30%削減しました。
TL;DRSABER-LLMは、従来の分類型から生成的推論へとシフトするマルチモーダル感情分析のための新フレームワークです。60万動画を含む大規模データセットSABERと、証拠抽出と推論を分離する構造化パラダイムを導入。皮肉のような複雑で矛盾を含む状況でも、既存のオープンソースモデルを凌駕する頑健な感情推論を実現しました。
Pricing