時空間物理系の表現学習は何を目指すべきか:次フレーム予測ではなく物理パラメータ推定で測る
時空間物理系の機械学習では、次フレーム予測の上手さが重視されがちですが、著者らは「下流の科学タスクに効く表現が本当に得られているか」を物理パラメータ推定で測る方向へ視点をずらします。 比較の結果、画素を直接当てにいく VideoMAE や自己回帰型の物理モデルより、潜在表現空間で未来を当てる JEPA 系のほうが、物理的に意味のある情報を保持しやすく、少ない fine-tuning データでも強いことが示されます。 重要なのは「物理システム向けに見える手法なら必ず有利」という結論ではない点で、物理モデリング専用手法の中でも差があり、表現学習の目的関数そのものが物理的有意味性を左右する、というのが主張の芯です。