Files
internal-docs/papers/md/PriSTI A Conditional Diffusion Framework for Spatiotemporal .md
Hongyu Yan 1cbfc6d53d 新增提取所有md文件的脚本
所有md文件都会被提取到/papers/md文件夹下
2026-01-26 18:22:48 +08:00

9.1 KiB
Raw Permalink Blame History

PriSTI A Conditional Diffusion Framework for Spatiotemporal

第一个问题请对论文的内容进行摘要总结包含研究背景与问题、研究目的、方法、主要结果和结论字数要求在150-300字之间使用论文中的术语和概念。

论文面向真实场景的spatiotemporal data不完整问题sensor failures、transmission loss研究spatiotemporal imputation以利用spatiotemporal dependence补全缺失值。既有RNN式autoregressive插补易出现error accumulation且多为确定性输出扩散模型可从Gaussian noise生成并避免串行误差但在ST数据上“conditional information的构造与利用”困难。为此提出PriSTI先对观测做linear interpolation得到增强的conditional information X并用Conditional Feature Extraction提取含temporal attention、spatial attention与MPNN(结合geographic adjacency A)的global context prior H_pri再在Noise Estimation Module中用H_pri计算注意力权重Q,K来自H_priV来自含噪输入引导εθ(Ẋ_t,X,A,t)去噪。实验在AQI-36、METR-LA、PEMS-BAY多缺失模式下PriSTI在MAE/MSE/CRPS上均优于CSDI、GRIN等并在高缺失率与sensor failure场景保持优势结论是“先验增强的条件特征+地理关系”能显著提升扩散式时空插补质量与稳健性。

第二个问题请提取论文的摘要原文摘要一般在Abstract之后Introduction之前。

Abstract—Spatiotemporal data mining plays an important role in air quality monitoring, crowd flow modeling, and climate forecasting. However, the originally collected spatiotemporal data in real-world scenarios is usually incomplete due to sensor failures or transmission loss. Spatiotemporal imputation aims to fill the missing values according to the observed values and the underlying spatiotemporal dependence of them. The previous dominant models impute missing values autoregressively and suffer from the problem of error accumulation. As emerging powerful generative models, the diffusion probabilistic models can be adopted to impute missing values conditioned by observations and avoid inferring missing values from inaccurate historical imputation. However, the construction and utilization of conditional information are inevitable challenges when applying diffusion models to spatiotemporal imputation. To address above issues, we propose a conditional diffusion framework for spatiotemporal imputation with enhanced prior modeling, named PriSTI. Our proposed framework provides a conditional feature extraction module first to extract the coarse yet effective spatiotemporal dependencies from conditional information as the global context prior. Then, a noise estimation module transforms random noise to realistic values, with the spatiotemporal attention weights calculated by the conditional feature, as well as the consideration of geographic relationships. PriSTI outperforms existing imputation methods in various missing patterns of different real-world spatiotemporal data, and effectively handles scenarios such as high missing rates and sensor failure. The implementation code is available at https://github.com/LMZZML/PriSTI.

第三个问题:请列出论文的全部作者,按照此格式:作者1, 作者2, 作者3

Mingzhe Liu, Han Huang, Hao Feng, Leilei Sun, Bowen Du, Yanjie Fu

第四个问题:请直接告诉我这篇论文发表在哪个会议或期刊,请不要推理或提供额外信息。

未在提供的论文内容中给出具体会议或期刊名称。

第五个问题:请详细描述这篇论文主要解决的核心问题,并用简洁的语言概述。

核心问题是将conditional diffusion model用于spatiotemporal imputation时如何“构造并利用”条件信息使模型既能避免RNN自回归插补的error accumulation又能有效学习复杂的时空依赖temporal dependencies、spatial global correlations、geographic relationships A。论文指出CSDI类方法常把observed values与noisy targets直接拼接输入仅靠mask区分导致序列趋势在高噪声步t≈T时不一致、增加学习难度且未充分利用地理邻接与跨节点相关。PriSTI通过“先插值增强条件信息→提取全局先验H_pri→用H_pri主导注意力权重、减少噪声对依赖学习的干扰”来解决。简洁概述解决扩散式时空插补中“条件信息噪声大、时空依赖难学、地理关系难融入”的关键瓶颈。

第六个问题:请告诉我这篇论文提出了哪些方法,请用最简洁的方式概括每个方法的核心思路。

(1) PriSTI条件扩散插补框架把缺失部分作为生成目标反向扩散pθ(Ẋ_{t-1}|Ẋ_t,X,A,t)从噪声逐步生成缺失值。(2) 线性插值增强条件信息Interpolate对每个节点时间序列做linear interpolation得到更完整、趋势一致的条件输入X。(3) Conditional Feature Extraction Moduleγ在仅含插值信息H=Conv(X)上用temporal attention + spatial attention + MPNN(A)提取global context prior H_pri。(4) Noise Estimation Module对混合输入H_in=Conv(X||Ẋ_t)学习时空依赖但用H_pri计算注意力权重Q,K来自H_priV来自H_in或H_tem以减轻噪声干扰并结合MPNN与空间注意力。(5) 空间注意力降复杂度将N个节点映射到k个virtual nodesk<N把空间注意力复杂度从O(N^2 d)降到O(N k d)。(6) 掩码训练策略point / block / hybrid含历史缺失模式在训练中随机“擦除观测”构造自监督插补目标。

第七个问题:请告诉我这篇论文所使用的数据集,包括数据集的名称和来源。

(1) AQI-36air quality北京36站PM2.5小时数据12个月来源Yi et al., “ST-MVL” (IJCAI 2016)[2]。(2) METR-LAtraffic speed洛杉矶高速207传感器、5分钟采样来源Li et al., DCRNN (ICLR 2018)[3]并沿用其数据设置。(3) PEMS-BAYtraffic speed湾区325传感器、5分钟采样同来源[3]三者的geographic adjacency A按站点/传感器距离用thresholded Gaussian kernel构建。

第八个问题:请列举这篇论文评估方法的所有指标,并简要说明这些指标的作用。

(1) MAE确定性插补误差的平均绝对偏差衡量点估计准确性越小越好。(2) MSE确定性插补误差的均方误差对大误差更敏感越小越好。(3) CRPS对概率插补分布D与真实值x的兼容性打分量化不确定性质量越小越好论文用100次采样近似分布并以0.05分位离散近似积分。(4) RMSE下游预测表V作为MSE的平方根用于评估imputation后对Graph WaveNet预测性能的影响越小越好

第九个问题:请总结这篇论文实验的表现,包含具体的数值表现和实验结论。

总体插补表III/IVPriSTI在所有数据集与缺失模式下优于CSDI与GRIN等。示例AQI-36 simulated failure(24.6%)上PriSTI MAE=9.03±0.07、MSE=310.39±7.03优于CSDI MAE=9.51±0.10、MSE=352.46±7.50对应CRPS PriSTI=0.0997优于CSDI=0.1056。METR-LA block-missing(16.6%)上PriSTI MAE=1.86±0.00、MSE=10.70±0.02优于CSDI 1.98±0.00、12.62±0.60CRPS PriSTI=0.0244优于CSDI=0.0260。PEMS-BAY block-missing(9.2%)上PriSTI MAE=0.78±0.00、MSE=3.31±0.01优于CSDI 0.86±0.00、4.39±0.02CRPS PriSTI=0.0093优于CSDI=0.0127。高缺失率图5在METR-LA缺失率90%时PriSTI相对其他方法MAE提升4.67%34.11%(block)与3.89%43.99%(point)。传感器完全失效RQ5AQI-36上两站点全程无观测时PriSTI MAE分别为10.23与15.20且优于GRIN。下游预测表V对AQI-36插补后用Graph WaveNet预测PriSTI使MAE从Ori. 36.97降至29.34RMSE从60.37降至45.08优于CSDI/GRIN/BRITS。结论PriSTI通过“条件先验+地理关系”在确定性与概率插补、极端稀疏与失效场景及下游任务上均更稳健。

第十个问题:请清晰地描述论文所作的工作,分别列举出动机和贡献点以及主要创新之处。

动机:(1) 时空数据缺失普遍且影响监测/交通等应用;(2) RNN自回归插补存在error accumulation且难输出不确定性(3) 扩散模型虽能做条件生成但在时空插补中“条件信息如何构造、如何避免噪声破坏依赖学习、如何融入地理关系A”是关键难题。

贡献点:(1) 提出PriSTI面向spatiotemporal imputation的conditional diffusion framework引入spatiotemporal global correlations与geographic relationships。(2) 提出Conditional Feature Extraction在插值后的条件信息上提取H_pri作为global context prior降低在高噪声下学习ST依赖的难度。(3) 提出Noise Estimation Module的“prior-guided attention”用H_pri产生注意力权重Q,K来自H_pri来引导对含噪输入的去噪从而缓解“观测+噪声拼接”带来的不一致与干扰。(4) 提出virtual nodes的空间注意力降复杂度方案O(N^2 d)→O(N k d)。

主要创新之处:把“先验条件特征(由插值与时空/地理编码提取)”显式用于扩散去噪阶段的注意力权重计算,实现更强的时空依赖建模与更鲁棒的扩散式插补。