深度学习在时间序列预测的总结和未来方向分析

来源：DeepHub IMBA
2023年是大语言模型和稳定扩散的一年，时间序列领域虽然没有那么大的成就，但是却有缓慢而稳定的进展。Neurips、ICML和AAAI等会议都有transformer 结构的改进，还出现了将数值时间序列数据与文本和图像合成的新体系结构，也出现了直接应用于时间序列的可能性的LLM，以及新形式的时间序列正则化/规范化技术。
我们这篇文章就来总结下2023年深度学习在时间序列预测中的发展和2024年未来方向分析,在今年的NIPs上，有一些关于transformer 、归一化、平稳性和多模态学习的有趣的新论文。但是在时间序列领域没有任何重大突破，只有一些实际的，渐进的性能改进和有趣的概念证明。1、Adaptive Normalization for Non-stationary Time Series
深度学习在时间序列预测的总结和未来方向分析 (https://ic.work/) AI 人工智能第1张
论文介绍了一种“模型不可知的归一化框架”来简化非平稳时间序列数据的预测。作者让SAN分两步操作:训练一个统计预测模型，然后训练实际的深度时间序列基础模型。统计模型对输入时间序列进行切片，以便学习更健壮的时间序列表示并去除非平稳属性。作者指出:“通过对切片级特性进行建模，SAN能够消除局部区域的非平稳性。”SAN还显式地预测目标窗口的统计信息。这使得它在处理非平稳数据时，与普通模型相比，能够更好地适应随时间的变化。采用transformer 模型作为基本预测模型，对典型的时间序列预测基准进行指标验证。作者发现SAN在这些基准数据集上持续提高了基本模型的性能。由于该模型结合了一个统计模型和一个普通的transformer ，我认为调优和调试可能会很棘手和麻烦。因为几乎所有的时间序列模型都将序列输入长度作为超参数。另外就是“切片”的切片与普通的序列窗口有何不同?作者还是没有说清楚。总的来说，我认为这仍然是一个相当强大的贡献，因为它的实验结果和即插即用属性。2、BasisFormer 深度学习在时间序列预测的总结和未来方向分析 (https://ic.work/) AI 人工智能第2张 BasisFormer使用可学习和可解释的“basis”来改进一般的transformer 体系结构。这里的“basis”指的是创建一个类似于NBeats的神经“basis”。该模型分为三个部分:基础模块、系数模块和预测模块。基模块试图以自监督的方式确定一组适用于历史和未来时间序列数据的数据基础趋势。basis模块通过对比学习和一个名为InfoNCE loss的特定损失函数。coef模型试图“模拟时间序列和一组基础趋势之间的相似性”。对于coef模型，作者使用了一个交叉注意力模块，该模块将basis和时间序列作为输入。然后将输出输入到包含多个MLP的预测模块中。作者在典型的时间序列预测数据集上评估他们的论文。发现BasisFormer比其他模型的性能提高了11-15%。BasisFormer还没有被拿来和Inverted Transformer比较，因为它还没有发布。似乎Inverted Transformer和可能的Crossformer 可能会略优于BasisFormer。还记的去年我们看到了“Are Transformers Effective for Time Series Forecasting?”这篇论文批评了许多Transformers 模型，并展示了一个简单的模型“D-Linear”如何超越它们。在2023年从BasisFromer开始，已经开始缓慢的解决这些问题，并超越上面提到的基准模型。这篇论文模型的技术是可靠的，但这篇论文优点难理解。因为作者介绍了学习“basis”的概念，但并没有真正解释这种方法的新颖性以及它与其他模型的不同之处。
3、Improving day-ahead Solar Irradiance Time Series Forecasting by Leveraging Spatio-Temporal Context论文提出了一种基于混合深度学习的架构，用于预测第二天的太阳能产量。太阳能的生产经常受到云层覆盖的影响，这在卫星图像数据中可以看到，但在数值数据中没有很好地体现出来。除了模型本身外，论文的另外贡献是研究人员构建并开源的多模态卫星图像数据集。作者描述了一个多级Transformers 架构，同时关注数值时间序列和图像数据。时间序列数据通过时间Transformers 图像通过视觉Transformers 。然后，交叉注意力模块将前两个模块的图像数据综合起来。最后数据进入一个输出预测的最终时态Transformers 。作者在论文中提到的另一个有用的想法被称为ROPE或旋转位置编码。这将在编码/位置嵌入中创建坐标对。这是用来描述从云层到太阳能站的距离。作者对他们的新数据集进行评估和基准测试，比较了Informer、Reformer、Crossformer和其他深度时间序列模型的性能。作者还在整合图像数据方面区分了困难和容易的任务，他们的方法优于其他模型。这篇论文提供了一个有趣的框架，ROPE的概念也很有趣，对于任何使用坐标形式的地理数据的人都有潜在的帮助。数据集本身对于多模态预测的持续工作非常有用，这是一项非常有益的贡献。
4、Large Language Models Are Zero-Shot Time Series Forecasters这篇论文探讨了预训练的llm能否直接以整数形式输入时间序列数据，并以零样本的方式预测未来数据。作者描述了使用GPT-3和GPT-4和开源LLMs不进一步修改结构直接与时间序列值交互的情况。最后还描述了他们对模型零样本训练行为起源的思考。作者假设，这种行为是提取知识的预训练的普遍通用性的结果。在上面提到的标准时间序列基准数据集评估他们的模型。虽然模型没有达到SOTA性能，但考虑到它完全是零样本并且没有额外的微调，所以表现还是很好的。
llm可以开箱即用地进行TS预测，因为它们都是在文本数据上训练的。这一领域可能值得未来进一步探索，这篇论文是一个很好的一步。但是该模型目前只能处理单变量时间序列,除了Neurips之外，ICML和ICLR 2023还重点介绍了几篇关于时间序列预测/分析的深度学习的论文。以下是一些我觉得很有趣的，并且对未来一年仍有意义的建议:1、Crossformer 深度学习在时间序列预测的总结和未来方向分析 (https://ic.work/) AI 人工智能第3张
该模型是专门为多元时间序列预测开发的。该模型采用维度分段嵌入机制。DSW嵌入与传统嵌入的不同之处在于它采用二维格式的数据。并且跨变量和时间维度显式地从MTS数据生成段。该模型在标准MTS数据集上进行了评估：在发布时时优于大多数其他模型，例如Informer和DLinear。作者还对dSW进行了消融研究。这篇来自ICLR的关于的论文在预测河流流量时表现不错，但是是在一次预测多个目标时，性能似乎会下降很多。也就是说，它的表现肯定比Informer和相关的Transformers 模型要好。
2、Learning Perturbations to Explain Time Series Predictions 深度学习在时间序列预测的总结和未来方向分析 (https://ic.work/) AI 人工智能第4张
大多数用于深度学习解释的扰动技术都是面向静态数据的。但是对于时间序列特别是多元TS需要更大范围的扰动来学习随机影响。作者提出了一种基于深度学习的方法，可以学习数据的掩码和相关的扰动，更好地解释特征的重要性。然后将掩码和扰动的输入传递给模型，并将输出与未扰动数据的输出进行比较。据两个输出之间的差值计算损失。越来越多的研究人员正在深入研究解释深度学习模型这是件好事。本文概述了现有的方法及其不足，并提出了一种改进的方法。我认为使用额外的神经网络来学习扰动的想法增加了不必要的复杂性,因为每当我们增加更多的层和额外的网络时，就会增加发生问题的概率，特别是在已经很大的网络上。别忘了奥卡姆剃刀定律如无必要，勿增实体,3、Learning Deep Time Index Models 深度学习在时间序列预测的总结和未来方向分析 (https://ic.work/) AI 人工智能第5张
本文通过光流和元学习来讨论预测，描述了学习如何预测非平稳时间序列。对于那些不熟悉的人来说，元学习通常被应用在计算机视觉数据集上，像MAML这样的论文可以对新的图像类进行少量的学习。MAML和其他模型都有一个内部循环和一个外部循环，其中外部循环教模型如何学习，内部循环对其进行微调以适应特定的任务。论文的作者采用了这一思想，并将其应用于几乎将每个非平稳性视为一个新的学习任务。新的“任务”是长时间序列序列的块。作者在ETH，temperature和exchange 数据集上测试了他们的模型。尽管他们的模型没有达到SOTA的结果，但它与当前的SOTA体系结构具有竞争力。这篇论文为时间序列预测提供了一个有趣的角度，相对于常规方法有了一个新的突破，我想就是他虽然没有超过SOTA但是还是被录用的原因之一吧。
4、Inverted Transformers are Effective for Time Series Forecasting 深度学习在时间序列预测的总结和未来方向分析 (https://ic.work/) AI 人工智能第6张
《Inverted Transformers》是2024年发表的一篇论文。这也是目前时间序列预测数据集上的SOTA。基本上，Inverted Transformers采用时间序列的Transformers架构并进行了翻转。整个时间序列序列用于创建令牌。然后，时间序列彼此独立进行嵌入表示。注意力对多个时间序列嵌入进行操作。它有点类似于Crossformer，但它的不同之处在于，它遵循标准Transformers架构。作者在标准时间序列数据集上评估模型目前优于所有其他模型，包括Informer, Reformer, Crossformer等。
这是一篇强大的论文，因为模型的表现优于现有的模型。但是在某些情况下，它优于模型的数值并不是那么显著。所以可以优先看看这篇论文并且进行测试。
最后说说TimeGPT，它没有在任何主要会议上被接受，而且它的评估方法也优点可疑，由于它不幸地在互联网上获得了相当多的介绍，所以我们要再提一下>
1、作者没有将他们的结果与其他SOTA类型模型进行比较，只是引用“测试集包括来自多个领域的30多万个时间序列，包括金融、网络流量、物联网、天气、需求和电力。”并且没有提供测试集的链接，也没有在他们的论文中说明这些数据集是什么。
2、论文中架构图和模型体系结构的描述非常糟糕。这看起来就像是作者复制了其他论文的图表，强加上注意力的定义和LLM相关的流行词汇。
3、作者的Nixtla公司非常小，可能是一家小型初创公司，它是否有足够的计算资源来完全训练一个“成功的时间序列基础模型”。虽然这样说法优点歧视，但是如果我说我一个人用一周训练了一个LLM，那估计都没人相信，对吧。OpenAI、谷歌、亚马逊、Meta等公司提供足够的计算资源来创建庞大的模型。如果TimeGPT真的是一个简单的Transformers 模型，并在大量的时间序列数据上训练它，为什么其他机构，甚至个人不能用它的大量gpu做到这一点呢?答案是，事情肯定没那么简单。时间序列创建“基础模型”的能力目前还不够完善。多元时间序列预测的一个重要组成部分是学习协变量之间的依赖关系。MTS的维度在不同的数据集之间差异很大。对于具有文本数据的Transformers ，我们总是将一个单词映射到一个数字id，然后创建一个特定维度的嵌入。对于MTS，不仅值可以更改，而且在一个数据集上可能有100个变量，而在另一个数据集上只有10个变量。这使得几乎不可能设计所有用途的映射层来将不同大小的MTS数据集映射到公共嵌入维度。所以还记得我们前几天发的Lag-Llama，也只是单变量的预测。
在其他时间序列上预训模型不会产生改进的结果。
在2023年，我们看到了Transformers 在时间序列预测中的一些持续改进，以及llm和多模态学习的新方法。随着2024年的进展，我们将继续看到在时间序列中使用Transformers 架构的进步和改进。可能会看到在多模态时间序列预测和分类领域的进一步发展。
作者：Isaac Godfried

深度学习在时间序列预测的总结和未来方向分析

相关推荐

伟测集成电路芯片测试基地竣工，晶圆级与成品测试项目全面启动。

俄罗斯光刻机突破，350nm技术成功实现，引领科技新篇章。

中国团队突破，全可编程拓扑光子芯片研制成功，引领科技新潮流。

上海新政力推人工智能、算力芯片，科技新风向，不容错过！

美国拟限AI大模型出口，全球科技格局生变，速览最新动态！

博世2024传感器新品：SCS智能互联与两大创新系列，引领行业变革。

OpenAI发布AI图片检测工具，准确率98%，并研发AI音频水印，引领新潮流。

AI医院小镇登陆清华，AI医生超人类，数天诊治万人，快来体验未来医疗！

谷歌AlphaFold 3预测生命分子，登Nature，免费开放，加速科研亿年！

OpenAI掌门人谈AI：末日说夸张，对技术革命持乐观审慎态度。

推荐

VCSEL芯片和光学解决方案提供商瑞识科技完成近亿元B1轮融资

一文带你搞懂开关电源电路

基于脱硝系统改造的自动化优化分析

阿诗特能源L1000液冷新品震撼上市，卓越性能，引领未来！

博世与芯驰科技全面深化战略合作围绕车用半导体核心技术

PLL锁相环：工作原理简述，高效同步控制的核心技术。

中科曙光助力北京航天总医院打造24小时在线的AI医疗助手

国产替代奋进高端，创新引领，开启替代新篇章。

模拟芯片与数字芯片各有独特优势，各具魅力，吸引你的目光。

本征半导体，基础材料之选，了解它，掌握电子世界的关键！

最近更新

PCM相变存储器有哪些特性？PCM相变存储器有哪些应用

你了解嵌入式软件的发展历程吗？如何分析嵌入式软件的问题？

深入学习嵌入式软件：嵌入式软件的开发流程是怎样的？

嵌入式软件有哪些特征？嵌入式软件Vector介绍

PCM相变存储器发展现状如何？PCM相变存储器有哪些技术特点？

PCM相变存储器发展历史了解吗？PCM相变存储器的工作原理是什么

征程6P全球首发！HSD炸裂登场，地平线携手奇瑞发布首款量产车型

你了解AVB传输协议吗？AVB传输协议对数据流的3个定义

一文详解时序约束是如何影响数字系统的

你了解HBM高带宽内存吗？你了解HBM3吗？

深度学习在时间序列预测的总结和未来方向分析

相关推荐

推荐

VCSEL芯片和光学解决方案提供商瑞识科技完成近亿元B1轮融资

一文带你搞懂开关电源电路

基于脱硝系统改造的自动化优化分析

阿诗特能源L1000液冷新品震撼上市，卓越性能，引领未来！

博世与芯驰科技全面深化战略合作 围绕车用半导体核心技术

PLL锁相环：工作原理简述，高效同步控制的核心技术。

中科曙光助力北京航天总医院打造24小时在线的AI医疗助手

国产替代奋进高端，创新引领，开启替代新篇章。

模拟芯片与数字芯片各有独特优势，各具魅力，吸引你的目光。

本征半导体，基础材料之选，了解它，掌握电子世界的关键！

最近更新

PCM相变存储器有哪些特性？PCM相变存储器有哪些应用

你了解嵌入式软件的发展历程吗？如何分析嵌入式软件的问题？

深入学习嵌入式软件：嵌入式软件的开发流程是怎样的？

嵌入式软件有哪些特征？嵌入式软件Vector介绍

PCM相变存储器发展现状如何？PCM相变存储器有哪些技术特点？

PCM相变存储器发展历史了解吗？PCM相变存储器的工作原理是什么

征程6P全球首发！HSD炸裂登场，地平线携手奇瑞发布首款量产车型

你了解AVB传输协议吗？AVB传输协议对数据流的3个定义

一文详解时序约束是如何影响数字系统的

你了解HBM高带宽内存吗？你了解HBM3吗？

博世与芯驰科技全面深化战略合作围绕车用半导体核心技术