文章地址:https://arxiv.org/abs/2508.06915

摘要:在流数据支撑各类应用的场景中,时间序列预测的重要性日益凸显。零样本时间序列预测(ZSF)在数据稀缺场景(如跨域迁移或极端条件下的预测)中具有极高价值,但传统模型难以应对这类场景。尽管时序预训练模型(TSPMs)在ZSF中展现出优异性能,但它们往往缺乏动态整合外部知识的机制。幸运的是,新兴的检索增强生成(RAG)技术为按需注入此类知识提供了可行途径,但RAG与TSPMs的融合仍较为罕见。为充分发挥两者优势,我们将RAG引入TSPMs,以提升零样本时间序列预测性能。 本文提出零样本时间序列快速预测框架QuiZSF(Quick Zero-Shot Time Series Forecaster),这是一种轻量级模块化框架,将高效检索与表征学习、模型适配相结合,专门用于ZSF任务。具体而言,我们构建了分层树状结构的时序检索底座ChronoRAG Base(CRB),用于大规模时序数据存储与域感知检索;提出多粒度序列交互学习器(MSIL),以提取细粒度和粗粒度的关联特征;设计双分支模型协同融合器(MCC),将检索到的知识与两类TSPMs(基于非大语言模型的TSPM和基于大语言模型的TSPM)进行对齐。 与现有基准模型相比,以基于非大语言模型的TSPM和基于大语言模型的TSPM分别作为基础模型时,QuiZSF在75%和87.5%的预测场景中均排名第一,同时在内存占用和推理速度方面保持了较高效率。

PART 1:研究背景与意义

一、零样本时间序列预测(ZSF)的核心价值

  • 应用场景:适配数据稀缺场景,如跨域预测(电力→气象)、极端条件预测(极端天气、突发疫情),解决传统模型“无监督/微调难”的痛点。

  • 现实意义:无需目标域训练数据,仅通过已有模式推理新时序趋势,为动态系统决策(如能源调度、健康监测)提供可靠支持。

二、现有技术的局限

技术类型

核心问题

时序预训练模型(TSPM)

1. 无法动态更新知识,微调成本高,破坏零样本“即插即用”特性;2. 未利用时序数据的结构相似性(跨域/域内相似模式)

检索增强生成(RAG)

虽能按需注入外部知识,但未与TSPM有效融合,缺乏针对时序数据的存储、检索及特征交互设计

三、研究意义

首次将RAG与TSPM深度结合,提出QuiZSF框架,解决ZSF中“知识动态更新”与“相似模式利用”两大核心问题,在提升预测精度的同时保持高效性,为数据稀缺场景的时序预测提供新范式。

PART 2:当前研究综述

一、时序预训练模型(TSPM)分类与局限

类型

代表模型

优势

局限

Non-LLM based TSPM

TTM、TimesFM、Moirai

专注时序特征,轻量化,零样本泛化较好

无法动态整合外部知识,跨域适配性有限

LLM based TSPM

Time-LLM、LLMTime、GPT4TS

利用LLM跨域迁移能力,支持文本交互

模态鸿沟(数值→文本),未利用时序结构相似性

二、检索增强生成(RAG)相关工作

  • 核心思路:通过检索外部知识增强模型输出,已成功应用于NLP(如开放域问答)。

  • 时序领域现状:部分研究尝试引入检索机制,但存在缺陷:1. 存储检索效率低,不支持大规模时序数据;2. 未建模目标与检索序列的交互特征;3. 无法适配两类TSPM的模态需求。

三、研究缺口

现有工作未实现“RAG的动态知识注入”与“TSPM的时序建模能力”的有效协同,缺乏针对ZSF的端到端数据-模型交互框架。

PART 3:研究现存挑战

一、高效域敏感的存储与检索

海量时序数据(百万级序列)需快速检索,且需兼顾域内精准匹配与跨域泛化,传统线性存储检索效率低,缺乏域感知能力。

二、多粒度特征提取

  • 检索序列来自不同域、尺度、噪声水平,简单拼接/平均会导致异质性干扰,需提取“细粒度依赖”与“粗粒度趋势”的多层面交互特征。

三、模态对齐的表征融合

  • TSPM分为数值型(Non-LLM)和文本型(LLM),需设计统一适配器:1. 数值型需无缝融合检索特征;2. 文本型需将数值特征转化为结构化文本提示,同时支持端到端优化。

PART 4:文章的主旨与主要内容

一、核心主旨

提出QuiZSF(Quick Zero-Shot Time Series Forecaster)——轻量模块化框架,通过“检索增强+特征交互+模态融合”,将RAG与TSPM结合,提升零样本时间序列预测的精度与效率。

二、主要内容(三大核心组件)

  1. ChronoRAG Base(CRB):构建分层树结构时序数据库,支持高效域敏感检索,存储27个数据集(7大域),提供Small/Medium/Large三个版本。

  2. Multi-grained Series Interaction Learner(MSIL):提取检索序列与目标序列的细粒度交互特征和粗粒度平均趋势,通过跨注意力融合为统一表征。

  3. Model Cooperation Coherer(MCC):双分支适配器,分别适配Non-LLM(残差融合)与LLM(结构化提示转化),结合MMD正则化对齐预测分布。

三、核心逻辑

检索相似时序→多粒度特征交互→模态对齐融合→零样本预测,全程保持“即插即用”特性,无需目标域微调。

PART 5:文章的创新点

创新点1:分层时序检索底座(CRB)与HHTR策略

  • CRB:采用“域划分→k-means聚类”的分层树结构,统一数据协议(滑动窗口、线性插值、ARROW存储),支持动态更新与高效索引。

  • HHTR策略:混合“域内局部匹配”与“全局原型匹配”,通过余弦相似度+欧氏距离复合度量,平衡检索精度与泛化性。

创新点2:多粒度序列交互学习(MSIL)

  • 同时建模“交互模式”(元素积+非线性投影,捕捉细粒度依赖)与“平均模式”(均值池化+转化,编码全局趋势)。

  • 通过跨注意力将两种模式与目标序列融合,解决异质性序列的特征整合问题。

创新点3:双分支模态协同融合(MCC)

  • 数值分支:残差连接融合MSIL特征与目标序列,适配Non-LLM的数值输入需求。

  • 文本分支:将MSIL特征转化为结构化提示(含域内/跨域模式总结),适配LLM的文本输入需求。

  • 引入MMD正则化,对齐预测与真实序列分布,减少幻觉。

PART 6:技术路线和实验程序

一、技术路线(端到端流程)

  1. 检索阶段:输入目标序列→CRB通过HHTR策略检索Top-K相似序列(域内占比ρ=60%)。

  2. 特征交互阶段:目标序列+检索序列→MSIL归一化→提取交互/平均模式→跨注意力融合生成R_fused。

  3. 模态融合阶段

    1. Non-LLM:R_fused与目标序列残差融合→输入TSPM预测。

    2. LLM:R_fused转化为结构化提示→输入TSPM预测。

  4. 优化阶段:MSE损失+MMD正则化→反向更新参数。

二、实验程序

类别

细节

数据集

1. 检索库(CRB):7大域27个数据集,分Small(34M点)/Medium(48M点)/Large(143M点);<br>2. 测试集:ETTh1/2、ETTm1/2、Weather

基线模型

13个SOTA模型,分三类:<br>- Non-LLM TSPM(TTM、Moirai等);<br>- LLM TSPM(Time-LLM、GPT4TS等);<br>- 其他架构(iTransformer、DLinear等)

实验设置

1. QuiZSF_T(Non-LLM):多源泛化ZSF(训练多源数据,零样本迁移到测试集);<br>2. QuiZSF_L(LLM):单源迁移ZSF(训练单源数据,跨域迁移)

评估指标

均方误差(MSE),最优结果加粗,次优下划线

PART 7:实验结果与讨论

一、核心性能结果

模型设置

关键结论

QuiZSF_T(Non-LLM)

在75%的ZSF场景中Top1,平均MSE优于所有零样本基线,甚至超越部分全样本模型(如FEDformer);Weather跨域测试表现最优

QuiZSF_L(LLM)

在87.5%的ZSF场景中Top1,8个跨域迁移设置中7个最优,显著优于Time-LLM、GPT4TS等

二、消融实验(验证组件有效性)

消融变体

ETTm1→ETTh2(MSE)

ETTm1→ETTm2(MSE)

结论

QuiZSF_L -w/o-RAG

0.394

0.296

移除RAG性能下降3.14%-5.34%,检索是ZSF的核心增益来源

QuiZSF_L -w/o-MSIL

0.387

0.286

简单平均替代MSIL导致性能下降,多粒度交互特征不可或缺

QuiZSF_L -w/o-Coherer

0.388

0.289

缺乏结构化提示转化,LLM无法有效利用数值特征,性能下降约2%

三、关键分析

  1. 复杂度:QuiZSF轻量化,模型大小与推理时间接近TTM,检索与交互模块开销极小。

  2. 超参数:最优配置为CRB-Medium、Top-K=8、ρ=60%,平衡精度与效率。

  3. 案例研究:RAG可平滑预测曲线,减少LLM的时序幻觉(ETTh2数据集MSE从0.479降至0.351)。

PPT 8:文章结论

一、核心结论

  1. 框架有效性:QuiZSF通过RAG与TSPM的深度融合,在零样本时序预测中实现SOTA性能,Non-LLM版本75%场景Top1,LLM版本87.5%场景Top1,且保持高效性。

  2. 组件价值:CRB解决高效检索问题,MSIL提取多粒度交互特征,MCC实现模态对齐,三者协同突破ZSF核心瓶颈。

  3. 泛化能力:在跨域(Weather)、细粒度(ETTm1)场景均表现优异,验证了框架的鲁棒性。

二、未来工作

  1. 开发更鲁棒的域专属TSPM,提升极端稀缺数据场景的性能。

  2. 优化检索库的稀疏连接,降低大规模检索的复杂度。

  3. 探索跨粒度时序学习方法,解决不同采样粒度的模式迁移问题。

三、核心贡献

为零样本时间序列预测提供了“数据-模型交互”的高效框架,首次验证了RAG与TSPM融合的可行性,为数据稀缺场景的时序预测提供新思路。

Logo

为武汉地区的开发者提供学习、交流和合作的平台。社区聚集了众多技术爱好者和专业人士,涵盖了多个领域,包括人工智能、大数据、云计算、区块链等。社区定期举办技术分享、培训和活动,为开发者提供更多的学习和交流机会。

更多推荐