AI研究 2026-01-29 タグ: cs.CL, cs.LG

手続き型事前学習：抽象データによる言語モデルのウォーミングアップ

要約

ウェブ規模のコーパスでの直接的な事前学習に代わる手法として、抽象的な構造化データを用いた初期学習の効果を検証した研究である。形式言語などで生成された「手続き型データ」をわずか0.1%先行学習させるだけで、自然言語やコードの学習効率が大幅に向上し、同じ損失値に到達するために必要なデータ量を最大45%削減できることが示された。

全文は有料プランで閲覧できます。

Unlock

全文は有料プラン限定です

ログインして試す

Pro

深掘りチャットで“理解の履歴”を残す

プランを見る

Proなら長文回答とスレッド保存で、論文ごとの知識DBを作れます。

手続き型事前学習：抽象データによる言語モデルのウォーミングアップ

要約

全文は有料プラン限定です

深掘りチャットで“理解の履歴”を残す

次に読む