时空预测介绍
时空预测任务理解与思考
一、前言
最近看了中科院在 TKDE 上发表的一篇关于时空数据挖掘的综述论文:[Exploring Progress in Multivariate Time Series Forecasting: Comprehensive Benchmarking and Heterogeneity Analysis]。这篇文章让我对时空预测任务有了更深的理解。本篇博客主要是对这篇综述的总结和一些个人的思考。
二、什么是 MTS?
MTS(Multivariate Time Series)即多变量时间序列,指由多个相互关联的变量组成的、有时间顺序的数据集合。它广泛应用于金融、气象、交通、医疗等领域。
在 MTS 预测中,有两个核心任务:
- LTSF(Long-Term Series Forecasting):关注长期预测,建模长期依赖;
- STF(Spatio-Temporal Forecasting):关注时空建模,通过捕捉空间相关性提升预测性能。
LTSF 模型特点:
- 序列层级相关建模(Series-level correlations)
- 频率域建模(Frequency-based methods)
- Patch-based Transformer 等模型
STF 模型特点:
- 结合卷积网络、图卷积网络与序列模型,形成时空神经网络(如 STGNN、TCN)
常用指标:
- 绝对误差指标:MAE、MSE、RMSE
- 相对误差指标:MAPE、WAPE、SMAPE
三、训练与优化设置
数据预处理:
- 常用归一化方法:
- Min-Max 归一化
- Z-score 标准化(多数研究采用)
训练技巧:
- Masked MAE 通常比普通 MAE 更有效;
- 可选技巧包括:
- 梯度裁剪(Gradient Clipping)
- 课程学习(Curriculum Learning)
- ……
四、不同数据集特点与模型选择建议
高级模型通常具备较强的拟合能力与归纳偏置,适用于特定模式;而基础模型(如线性模型)泛化能力更强,适用于模式不明显的场景。
1. 时间建模与模型选择
可将数据集按时间模式划分为三类:
时间模式类型 | 建议模型类型 | 原因说明 |
---|---|---|
模式稳定(stable) | 高级神经网络 | 可学习复杂的周期性与模式 |
分布漂移明显 | 基础神经网络 | 高级模型容易过拟合 |
无明确模式 | 基础神经网络 | 拟合能力强反而容易学到虚假特征 |
✅ 总结: 模式稳定数据适合高级模型;模式漂移或不明确时,基础模型可能更稳健。
2. 空间建模与模型选择
将数据集按空间特性划分为两类:
- 存在空间样本不可区分性(Significant Spatial Sample Indistinguishability)
- 不存在空间样本不可区分性
空间不可区分性是指:在相同时间点,不同位置的历史观测数据非常相似,但其未来演化却存在显著差异。这种异质性使得简单模型(如 MLP、RNN)难以区分不同空间位置的预测。
与时间建模不同,空间依赖更难建模与评估,图卷积网络(GCNs)虽常用于空间建模,但对空间异质性的理解仍有待深入。
指标推荐:
综述中推荐使用 r1 和 r2 两个指标量化空间不可区分性(可参考 STID、ST-Norm 的设计思路)。
建议总结:
空间特性类型 | 建议做法 |
---|---|
不存在显著空间不可区分性 | 无需刻意建模空间依赖 |
存在显著空间不可区分性 | 需要显式建模异质性,可显著提升性能 |
五、个人思考
这篇综述提供了系统的分析框架来理解不同模型在不同数据分布下的表现,对于今后选择模型、设计实验具有很强的指导意义。
尤其是对空间不可区分性的定义与量化方式,弥补了当前研究中对于“空间依赖”缺乏定量分析的不足,也让我在今后的研究中会更加重视数据本身的异质性特征。
写于清华校园某个夜晚 🌙