AI研究 2026-02-01 タグ: cs.LG, eess.IV

MEGのための次脳トークン予測のスケーリング

本研究では、500時間以上の大規模なMEG（磁気脳鳴図）データセットであるCamCAN、Omega、MOUSを統合し、多チャネルの脳信号を離散的なトークン列として予測する大規模自己回帰モデル「FlatGPT」を構築した。

論文図解

TL;DR（結論）

本研究では、500時間以上の大規模なMEG（磁気脳鳴図）データセットであるCamCAN、Omega、MOUSを統合し、多チャネルの脳信号を離散的なトークン列として予測する大規模自己回帰モデル「FlatGPT」を構築した。独自の「BrainTokMix」トークナイザーにより時空間情報を効率的に圧縮し、補助的なメタデータを用いずに最長1分間の文脈から数分間に及ぶ脳信号を再帰的に生成することで、長期的な信号の安定性と入力文脈への特異性を実現している。学習に用いていない未知のデータセットを用いた厳密な検証を通じて、生成された信号が神経生理学的な妥当性を保ちつつ、特定の被験者やタスクの状態を反映した未来の状態を予測できることを実証し、脳信号のスケーリングの有効性を示した。

なぜこの問題か

脳活動の未来を予測することは、自然知能と人工知能の両方において極めて重要な課題であり、神経科学の分野では予測符号化や自由エネルギー原理といった枠組みでその重要性が議論されてきた。近年、言語や画像、動画の分野では、大規模なトランスフォーマーモデルを用いて「次に来るデータ」を予測するスケーリング手法が劇的な成功を収めており、モデルがデータを通じて世界モデルを内面化することが示されている。しかし、この強力なパラダイムを脳活動データに適用する試みは、信号の複雑さゆえに多くの困難に直面してきた。特にMEG（磁気脳鳴図）は、ミリ秒単位の高い時間分解能と豊富な情報密度を持つ一方で、多チャネルの連続値であり、信号対雑音比（SNR）が低く、人間による直接的な解釈が極めて困難であるという特性を持つ。既存の脳信号生成モデルは、数秒程度の短い文脈の予測に限定されることが多く、数分間にわたる長期的な脳活動のダイナミクスを安定して生成することは困難であった。また、異なるデータセットやスキャナー、被験者の個体差をまたいで汎用的に機能するモデルを構築することも、セッション間の変動が大きいために大きな障壁となっていた。…

核心：何を提案したのか

本研究の核心は、MEGのソース空間データを離散的なトークンストリームとして扱い、次の脳トークンを予測する大規模自己回帰モデル「FlatGPT」を提案した点にある。このアプローチは、MEG信号を言語や画像と同様のトークン形式に変換することで、最新のマルチモーダルモデルの設計パターンを脳データに直接適用できるようにした革新的なものである。モデルの構築にあたっては、CamCAN、Omega、MOUSという世界最大級の公開MEGデータセットを統合し、合計500時間以上、数千セッションに及ぶ大規模なコーパスを使用した。これは、MEG研究におけるデータスケールの限界を大きく押し広げる試みである。…

続きはログイン/プランで閲覧できます。

ログインで全文を月 2 本まで無料で読めます

ログインして続きを読む

無料プランで全文は月 2 本まで読めます。