本研究では、大規模言語モデルの推論プロセスを言語化から切り離し、連続的な潜在空間における計画として再定義する新しいフレームワーク「PLaT」を提案している。従来の思考の連鎖(CoT)が抱えていた計算コストの増大や、離散的なトークン選択による推論経路の崩壊という課題に対し、推論を司るプランナーと、その思考をテキストに変換するデコーダーを分離した構造を採用することで、推論の動的な終了や中間状態の解釈を可能にした。数学的ベンチマークを用いた検証の結果、PLaTは従来のベースラインと比較して決定論的な回答精度では及ばないものの、多様な推論経路を探索する能力において極めて高いスケーラビリティを示すことが確認されており、より広範な解空間を学習していることが示唆されている。
本研究では、大規模言語モデルの推論プロセスを言語化から切り離し、連続的な潜在空間における計画として再定義する新しいフレームワーク「PLaT」を提案している。従来の思考の連鎖(CoT)が抱えていた計算コストの増大や、離散的なトークン選択による推論経路の崩壊という課題に対し、推論を司るプランナーと、その思考をテキストに変換するデコーダーを分離した構造を採用することで、推論の動的な終了や中間状態の解釈を可能にした。数学的ベンチマークを用いた検証の結果、PLaTは従来のベースラインと比較して決定論的な回答精度では及ばないものの、多様な推論経路を探索する能力において極めて高いスケーラビリティを示すことが確認されており、より広範な解空間を学習していることが示唆されている。
大規模言語モデルにおける思考の連鎖(CoT)は、複雑な問題を中間ステップに分解することで高い推論能力を実現してきたが、いくつかの根本的な理論的ボトルネックに直面している。その一つが「推論経路の崩壊」と呼ばれる現象であり、モデルが生成の各ステップで語彙の中から離散的なトークンを選択することを強制されるため、他の有効な推論経路の確率が切り捨てられてしまうという問題である。この性質により、モデルは高次元空間において複数の潜在的な推論戦略を重ね合わせの状態で維持することができず、一度最適ではないトークンを選択すると回復不能な誤りに陥ることが多い。また、現在のモデルは非常に長い中間トークンのシーケンスを生成するため、計算コストが極めて高くなるという実用上の課題も抱えている。 これらの非効率性を軽減するために、推論の一部を連続的な隠れ状態で行う潜在的推論の研究が進められているが、既存の手法は主にエンドツーエンドの暗黙的なパラダイムを採用している。これにより、中間状態がブラックボックス化して解釈が困難になるという透明性の欠如や、推論時に固定されたステップ数に依存しなければならないという制約が生じている。…
本論文が提案する「PLaT(Planning with Latent Thoughts)」は、潜在的な推論を計画プロセスとして再定式化し、推論と言語化を完全に分離する新しいフレームワークである。このフレームワークの核心は、推論を連続的な多様体上での決定論的な軌跡としてモデル化し、必要に応じて別のデコーダーがそれらの思考をテキストに変換するという設計にある。これにより、モデルは固定されたハイパーパラメータに頼ることなく、推論をいつ終了させるかを動的に決定できるようになる。PLaTのアーキテクチャは、潜在的なプランナーと、言語化のためのデコーダーという二つの独立したコンポーネントで構成されている。…
続きはログイン/プランで閲覧できます。
続きを読む
無料プランで全文は月 2 本まで読めます。
Related