海洋監視のための合成データを用いた船舶の単眼3D再構成
TL;DR本研究は、合成データのみで学習し、推論時には単一の画像から実世界の船舶を効率的に3D再構成するパイプラインを提案しています。Splatter Imageネットワークを用いて船舶を3Dガウス分布の疎な集合として表現し、合成データセットで学習することで、実世界の3Dアノテーションなしに高精度な再構成を実現しました。
Cog AI Archive
TL;DRRedSageは、プライバシーリスクを回避しつつ多様なセキュリティ業務を支援するために開発された、オープンソースのサイバーセキュリティ特化型LLMである。118億トークンの専門データによる事前学習と、エージェントベースのパイプラインで生成された26.6万件の指示データによる調整を経て、既存モデルを上回る性能を実現した。
TL;DR本研究は、合成データのみで学習し、推論時には単一の画像から実世界の船舶を効率的に3D再構成するパイプラインを提案しています。Splatter Imageネットワークを用いて船舶を3Dガウス分布の疎な集合として表現し、合成データセットで学習することで、実世界の3Dアノテーションなしに高精度な再構成を実現しました。
TL;DR単眼動画から任意のカメラ軌道でシーンを再生する技術において、大きな角度変化に伴う幾何学的曖昧さと時間的不整合の問題を解決する「FreeOrbit4D」を提案。前景と背景を分離し、拡散モデルを用いて幾何学的に完全な4Dプロキシを再構成することで、学習不要で高品質な視点変更動画の生成を実現しました。
TL;DR大規模ボリュームデータのコンパクトな表現手法であるINR(Implicit Neural Representations)に対し、データのノイズやモデルの予測不確実性を単一のフォワードパスで推定できる「REV-INR」を提案。従来の決定論的モデルの課題を解決し、高速かつ高精度な再構成と信頼性の高い可視化を実現しました。
Pricing