QuiZSF：面向零样本时间序列预测的高效数据模型交互框架

在流数据支撑各类应用的场景中，时间序列预测的重要性日益凸显。零样本时间序列预测（ZSF）在数据稀缺场景（如跨域迁移或极端条件下的预测）中具有极高价值，但传统模型难以应对这类场景。尽管时序预训练模型（TSPMs）在ZSF中展现出优异性能，但它们往往缺乏动态整合外部知识的机制。幸运的是，新兴的检索增强生成（RAG）技术为按需注入此类知识提供了可行途径，但RAG与TSPMs的融合仍较为罕见。为充分发挥两

lijincai134579

1012人浏览 · 2025-11-07 18:11:30

lijincai134579 · 2025-11-07 18:11:30 发布

文章地址：https://arxiv.org/abs/2508.06915

摘要：在流数据支撑各类应用的场景中，时间序列预测的重要性日益凸显。零样本时间序列预测（ZSF）在数据稀缺场景（如跨域迁移或极端条件下的预测）中具有极高价值，但传统模型难以应对这类场景。尽管时序预训练模型（TSPMs）在ZSF中展现出优异性能，但它们往往缺乏动态整合外部知识的机制。幸运的是，新兴的检索增强生成（RAG）技术为按需注入此类知识提供了可行途径，但RAG与TSPMs的融合仍较为罕见。为充分发挥两者优势，我们将RAG引入TSPMs，以提升零样本时间序列预测性能。本文提出零样本时间序列快速预测框架QuiZSF（Quick Zero-Shot Time Series Forecaster），这是一种轻量级模块化框架，将高效检索与表征学习、模型适配相结合，专门用于ZSF任务。具体而言，我们构建了分层树状结构的时序检索底座ChronoRAG Base（CRB），用于大规模时序数据存储与域感知检索；提出多粒度序列交互学习器（MSIL），以提取细粒度和粗粒度的关联特征；设计双分支模型协同融合器（MCC），将检索到的知识与两类TSPMs（基于非大语言模型的TSPM和基于大语言模型的TSPM）进行对齐。与现有基准模型相比，以基于非大语言模型的TSPM和基于大语言模型的TSPM分别作为基础模型时，QuiZSF在75%和87.5%的预测场景中均排名第一，同时在内存占用和推理速度方面保持了较高效率。

PART 1：研究背景与意义

一、零样本时间序列预测（ZSF）的核心价值

应用场景：适配数据稀缺场景，如跨域预测（电力→气象）、极端条件预测（极端天气、突发疫情），解决传统模型“无监督/微调难”的痛点。
现实意义：无需目标域训练数据，仅通过已有模式推理新时序趋势，为动态系统决策（如能源调度、健康监测）提供可靠支持。

二、现有技术的局限

技术类型	核心问题
时序预训练模型（TSPM）	1. 无法动态更新知识，微调成本高，破坏零样本“即插即用”特性；2. 未利用时序数据的结构相似性（跨域/域内相似模式）
检索增强生成（RAG）	虽能按需注入外部知识，但未与TSPM有效融合，缺乏针对时序数据的存储、检索及特征交互设计

三、研究意义

首次将RAG与TSPM深度结合，提出QuiZSF框架，解决ZSF中“知识动态更新”与“相似模式利用”两大核心问题，在提升预测精度的同时保持高效性，为数据稀缺场景的时序预测提供新范式。

PART 2：当前研究综述

一、时序预训练模型（TSPM）分类与局限

类型	代表模型	优势	局限
Non-LLM based TSPM	TTM、TimesFM、Moirai	专注时序特征，轻量化，零样本泛化较好	无法动态整合外部知识，跨域适配性有限
LLM based TSPM	Time-LLM、LLMTime、GPT4TS	利用LLM跨域迁移能力，支持文本交互	模态鸿沟（数值→文本），未利用时序结构相似性

二、检索增强生成（RAG）相关工作

核心思路：通过检索外部知识增强模型输出，已成功应用于NLP（如开放域问答）。
时序领域现状：部分研究尝试引入检索机制，但存在缺陷：1. 存储检索效率低，不支持大规模时序数据；2. 未建模目标与检索序列的交互特征；3. 无法适配两类TSPM的模态需求。

三、研究缺口

现有工作未实现“RAG的动态知识注入”与“TSPM的时序建模能力”的有效协同，缺乏针对ZSF的端到端数据-模型交互框架。

PART 3：研究现存挑战

一、高效域敏感的存储与检索

海量时序数据（百万级序列）需快速检索，且需兼顾域内精准匹配与跨域泛化，传统线性存储检索效率低，缺乏域感知能力。

二、多粒度特征提取

检索序列来自不同域、尺度、噪声水平，简单拼接/平均会导致异质性干扰，需提取“细粒度依赖”与“粗粒度趋势”的多层面交互特征。

三、模态对齐的表征融合

TSPM分为数值型（Non-LLM）和文本型（LLM），需设计统一适配器：1. 数值型需无缝融合检索特征；2. 文本型需将数值特征转化为结构化文本提示，同时支持端到端优化。

PART 4：文章的主旨与主要内容

一、核心主旨

提出QuiZSF（Quick Zero-Shot Time Series Forecaster）——轻量模块化框架，通过“检索增强+特征交互+模态融合”，将RAG与TSPM结合，提升零样本时间序列预测的精度与效率。

二、主要内容（三大核心组件）

ChronoRAG Base（CRB）：构建分层树结构时序数据库，支持高效域敏感检索，存储27个数据集（7大域），提供Small/Medium/Large三个版本。
Multi-grained Series Interaction Learner（MSIL）：提取检索序列与目标序列的细粒度交互特征和粗粒度平均趋势，通过跨注意力融合为统一表征。
Model Cooperation Coherer（MCC）：双分支适配器，分别适配Non-LLM（残差融合）与LLM（结构化提示转化），结合MMD正则化对齐预测分布。

三、核心逻辑

检索相似时序→多粒度特征交互→模态对齐融合→零样本预测，全程保持“即插即用”特性，无需目标域微调。

PART 5：文章的创新点

创新点1：分层时序检索底座（CRB）与HHTR策略

CRB：采用“域划分→k-means聚类”的分层树结构，统一数据协议（滑动窗口、线性插值、ARROW存储），支持动态更新与高效索引。
HHTR策略：混合“域内局部匹配”与“全局原型匹配”，通过余弦相似度+欧氏距离复合度量，平衡检索精度与泛化性。

创新点2：多粒度序列交互学习（MSIL）

同时建模“交互模式”（元素积+非线性投影，捕捉细粒度依赖）与“平均模式”（均值池化+转化，编码全局趋势）。
通过跨注意力将两种模式与目标序列融合，解决异质性序列的特征整合问题。

创新点3：双分支模态协同融合（MCC）

数值分支：残差连接融合MSIL特征与目标序列，适配Non-LLM的数值输入需求。
文本分支：将MSIL特征转化为结构化提示（含域内/跨域模式总结），适配LLM的文本输入需求。
引入MMD正则化，对齐预测与真实序列分布，减少幻觉。

PART 6：技术路线和实验程序

一、技术路线（端到端流程）

检索阶段：输入目标序列→CRB通过HHTR策略检索Top-K相似序列（域内占比ρ=60%）。
特征交互阶段：目标序列+检索序列→MSIL归一化→提取交互/平均模式→跨注意力融合生成R_fused。
模态融合阶段：
1. Non-LLM：R_fused与目标序列残差融合→输入TSPM预测。
2. LLM：R_fused转化为结构化提示→输入TSPM预测。
优化阶段：MSE损失+MMD正则化→反向更新参数。

二、实验程序

类别	细节
数据集	1. 检索库（CRB）：7大域27个数据集，分Small（34M点）/Medium（48M点）/Large（143M点）；<br>2. 测试集：ETTh1/2、ETTm1/2、Weather
基线模型	13个SOTA模型，分三类：<br>- Non-LLM TSPM（TTM、Moirai等）；<br>- LLM TSPM（Time-LLM、GPT4TS等）；<br>- 其他架构（iTransformer、DLinear等）
实验设置	1. QuiZSF_T（Non-LLM）：多源泛化ZSF（训练多源数据，零样本迁移到测试集）；<br>2. QuiZSF_L（LLM）：单源迁移ZSF（训练单源数据，跨域迁移）
评估指标	均方误差（MSE），最优结果加粗，次优下划线

PART 7：实验结果与讨论

一、核心性能结果

模型设置	关键结论
QuiZSF_T（Non-LLM）	在75%的ZSF场景中Top1，平均MSE优于所有零样本基线，甚至超越部分全样本模型（如FEDformer）；Weather跨域测试表现最优
QuiZSF_L（LLM）	在87.5%的ZSF场景中Top1，8个跨域迁移设置中7个最优，显著优于Time-LLM、GPT4TS等

二、消融实验（验证组件有效性）

消融变体	ETTm1→ETTh2（MSE）	ETTm1→ETTm2（MSE）	结论
QuiZSF_L -w/o-RAG	0.394	0.296	移除RAG性能下降3.14%-5.34%，检索是ZSF的核心增益来源
QuiZSF_L -w/o-MSIL	0.387	0.286	简单平均替代MSIL导致性能下降，多粒度交互特征不可或缺
QuiZSF_L -w/o-Coherer	0.388	0.289	缺乏结构化提示转化，LLM无法有效利用数值特征，性能下降约2%

三、关键分析

复杂度：QuiZSF轻量化，模型大小与推理时间接近TTM，检索与交互模块开销极小。
超参数：最优配置为CRB-Medium、Top-K=8、ρ=60%，平衡精度与效率。
案例研究：RAG可平滑预测曲线，减少LLM的时序幻觉（ETTh2数据集MSE从0.479降至0.351）。

PPT 8：文章结论

一、核心结论

框架有效性：QuiZSF通过RAG与TSPM的深度融合，在零样本时序预测中实现SOTA性能，Non-LLM版本75%场景Top1，LLM版本87.5%场景Top1，且保持高效性。
组件价值：CRB解决高效检索问题，MSIL提取多粒度交互特征，MCC实现模态对齐，三者协同突破ZSF核心瓶颈。
泛化能力：在跨域（Weather）、细粒度（ETTm1）场景均表现优异，验证了框架的鲁棒性。