一. Characteristics of ST Data

时空数据,顾名思义其主要由时间维度和空间维度数据组成,数据呈现多面立体型

首先,考虑在空间维度上有哪些特性值得我们思考???时间维度又有哪些特征是我们在考虑时序时必须考虑到的呢???

空间相关

1)spatial closeness  

地理学第一定律:Everything is related, similar things are more closely related
2)spatial hierarchy

元素空间粒度不同,具有不同的空间结构层次——多层次性、多面性
3)spatial distance

描述空间对象物理距离

 时间相关——时序的重要特性

1)Closeness

根据时间连续性,一般情况下,相邻时间的数据具有很强的相似性。其特征表示相近(you could see it after embedding)。
2)Periodicity

季节性:序列的平均值有规律的、周期性的变化,称时间序列表现出季节性。 季节性变化通常遵循时钟和日历——一般一天、一周或一年的重复。
3)Trend

趋势性:时序随时间变化整体呈现出的一种上升或下降趋势(在一定时间内单调)

 二. 时空(ST)大数据挖掘研究的一种可行paradigm:时空大数据综合时、空领域内知识系统,结合AI,赋能智慧城市。

**主体意识:城市——时空场——数据生产者—— Different subjects correspond to different problems, corresponding to different models and data elements.

One possible analyzsis thought

        城市每天的生产生活活动都会产生海量的信息;根据任务场景的不同,选取需要的数据,进行清洗;又根据城市/社会模型以及所选数据的时空特性(不同领域的数据具有不同的特异属性--后续分享)综合建立所需的模型。

三. How to do it ? 

Modeling pipeline of Spatio-Temporal AI

Step1.分析原生数据(Raw data):POI兴趣点,RN路网结构,Traj轨迹数据等。
Step2.(Dataset)转换Raw数据为更加适配神经网络模型的数据格式——转换合适数据类型时空轨迹、时空格子数据、时空图数据、时空序列数据
Step3.(Model selection and ST-AI model build)模型选择与搭建

(1)机器学习的方法;

(2)ST神经网络(优点):

2.1)相对之下有更大的容量,有利于时空模型的构建:Larger capacity; 

2.2)自动特征提取Auto featre extraction;

2.3)考虑额外的外部因素,如天气和时间的影响friendly to cross-domain data fusion,e.g., considring external factors.

搭建模型的基础组件模块:

 四. 下游任务:

时空数据挖掘的主要下游任务有:预测、异常检测、数据插补、推荐、任务规划、分类等。

在建模过程中,需要先明确任务目标,才能更好选择使用哪些理论和基础block,并设计合适的loss Function。

ST科研分享开端——认识时空场,发现运行规律

随着机器学习、深度学习的不断发展,时空分析领域不仅仅限于使用物联网传感器检测、运筹统计、GIS空间数据分析、地统计等方向,AI+X赋能众多“基科”,推动了全新的数据挖掘建模方式。

接下来本频道将交替更新time serise 、Spatiotemporal科研入门相关知识的讲解和论文讲解分享。从基础理论的角度出发,有侧重地讲述数据科学、网络科学以及AI赋能下的ST-BD。

期待有志同道合的博友一起学习交流 ^-^ !

Logo

汇聚原天河团队并行计算工程师、中科院计算所专家以及头部AI名企HPC专家,助力解决“卡脖子”问题

更多推荐