タグ: cond-mat.stat-mech

AI研究 2026-02-16

意味的チャンク分割と自然言語のエントロピー：階層構造から「約1ビット/文字」を説明する試み。

印刷された英語のエントロピー率が「約1ビット/文字」と推定されるほど小さいことは、ランダムなテキストに期待される「約5ビット/文字」と比べて大きな冗長性を含むことを意味し、その理由を意味の階層構造から説明しようとしています。 / 大規模言語モデルを使って文書を意味的に一貫した塊へ再帰的に分割し、トークンを葉にもつ「意味木」を作ったうえで、最大分岐数Kだけで定まるランダムなK分木アンサンブルにより、その木が現れる確率を計算できる形にします。 / 意味木の確率から得た理論的なエントロピー率の推定は、次トークン確率から得るクロスエントロピー推定と多様なコーパスで近くなり、さらにエントロピー率は固定ではなくコーパスの意味的複雑さに応じて系統的に増えるという見通しを示します。

6195 字

読む →

AI研究 2026-01-29

トポロジカルな凍結を緩和するスケーラブルなFlow-basedアプローチ

4次元SU(3)ゲージ理論の格子シミュレーションにおいて、連続極限でトポロジカルなサンプリングが困難になる「トポロジカルな凍結」を解決するため、確率的正規化フロー（SNF）を用いた新しい手法が提案されました。

5994 字

読む →

生成AI研究を、要点から追う。

最新の記事

意味的チャンク分割と自然言語のエントロピー：階層構造から「約1ビット/文字」を説明する試み。

トポロジカルな凍結を緩和するスケーラブルなFlow-basedアプローチ