AI研究 2026-01-29 タグ: cs.LG

Grasynda：グラフに基づく合成時系列データの生成

Grasyndaは、単変量の時系列データをグラフ構造へと変換し、状態間の遷移確率を基に現実的な合成データを生成する新しいデータ拡張手法である。時系列を離散的な状態（ノード）とそれらの遷移（エッジ）としてモデル化することで、データの局所的なパターンと全体的な構造の両方を効果的に符号化し、統計的性質を維持したデータ生成を可能にする。 6つのベンチマークデータセットを用いた検証の結果、NHITSやKANなどの最新モデルにおいて、AmazonのChronosで採用されている手法を含む既存のデータ拡張技術を上回る予測精度の向上が確認された。この手法はSTL分解を併用することで、トレンドや季節性といった非定常な特性を保持しながら、効率的かつ高精度なデータ拡張を実現し、深層学習モデルの汎化性能を大幅に向上させる実用的な枠組みを提供している。

論文図解

TL;DR（結論）

なぜこの問題か

時系列予測の分野では、近年の深層学習アーキテクチャの進展により、ARIMAや指数平滑法といった伝統的な統計手法に代わる強力な選択肢が登場している。ChronosやNHITS、PatchTSTといった最新のニューラルネットワークは、ベンチマークにおいて極めて高い性能を示しているが、その真価を発揮し効果的に汎化するためには、膨大な学習サンプルが必要となる。しかし、現実世界のビジネスや科学的なシナリオにおいて、十分な量の時系列データを収集することは必ずしも容易ではない。データが不足している場合、深層学習モデルは学習データを単に記憶してしまい、未知のデータに対して適切に予測できない過学習の状態に陥るリスクが高まる。この課題を解決するためにデータ拡張技術が利用されるが、既存の手法にはいくつかの重大な限界が存在している。例えば、ジッタリング（ノイズ付加）やスケーリングといった単純な変換手法は、実装が容易で計算負荷も低いものの、時系列データが持つ重要な時間的依存関係を破壊してしまったり、現実的なバリエーションを十分に導入できなかったりすることが多い。…

核心：何を提案したのか

本論文が提案する「Grasynda（GRAph-based SYNthetictimeseriesDAtageneration）」は、時系列データをグラフ構造に変換し、その遷移確率行列を基に新しい時系列を合成する革新的なフレームワークである。この手法の核心は、時系列の各観測値を離散的な「状態」として定義し、連続する状態間の遷移をグラフのエッジとしてモデル化する点にある。これにより、時系列の背後にあるデータ生成プロセスを確率的な遷移モデルとして動的に捉えることが可能になる。具体的には、単変量の時系列をノード（状態）と有向エッジ（遷移）からなるネットワークへと変換し、そのエッジの重みとして遷移確率を算出する。…

続きはログイン/プランで閲覧できます。

ログインで全文を月 2 本まで無料で読めます

ログインして続きを読む

無料プランで全文は月 2 本まで読めます。