Python 数据分析之:pandas 中的日期相关数据处理:to_datetime() 完成日期的转换和生成;日期数据处理(获取年月日、判断是否为闰年);使用日期对象;date_range
从 2021-01-01 开始每隔一天产生一个日期每隔一个月产生一个日期- 使用函数;每次统计一定量的数据,然后统计出这些数据中的 open high low close 数据
·
文章目录
参数说明
通过将多种形式的日期转换成标准形式
整合多列中的信息组成一个日期
- 注意,使用这种方式组合多个列中的时间信息的时候,列的名称分别必须是:
- year,
- month
- day
- hour
- minute
- second
日期对象的使用
数据导入
将“原日期” 的类型转为 datetime 类型
调用 Series 中的 dt 对象来获取各种信息
- 年: series.dt.year
- 月: series.dt.month
- 日: series.dt.day
- 星期几: series.dt.day_name()
- 当前日期的季度: series.dt.quarter
- 是否是年底: series.dt.is_year_end
获取特定日期 / 日期区间数据
- 将时间列放到数据最前面的一列(非必须)
- 按照时间列进行排序(非必须)
- 首先将时间列作为索引
- 可以直接按照年份索引
- 可以直接按照年份+月份索引
- 可以直接按照日期索引
- 可以索引日期的区间
按照不同的时期进行数据统计
- 将日期列作为索引
- 按照年进行统计求和
- 按照季度统计求和
- 按照月统计
- 按星期统计
- 按照天统计
按照时期显示数据
- 只 按照年份显示数据;这里使用的是 A 而不是 AS
- 按照季度显示数据
- 按照月显示数据
- 按照星期显示
按照时期统计 & 显示
- 按照年
- 按照季度
- 按照月
- 按照星期
时间序列 date_range
-
从 2021-01-01 开始每隔一天产生一个日期
-
每隔一个月产生一个日期
时间序列的降采样和升采样
降采样
- 将原本 1 分钟的时间频率降低到 3 分钟每次,这样操作频率降低了,因此,需要将指定数据聚合的方式,下面的例子中使用的是 sum 方式
- 在下面的例子中,原本的数据是每天,现在通过 resample 降采样成每个周采样一次
- 下面的例子又降采样成月
升采样
- 升采样过程中如果没有数据就用NAN 来代替
- 可以按照缺失值填补的方式:ffill 和 bfill 来填补
时间序列数据汇总
- 使用 ohlc
函数;每次统计一定量的数据,然后统计出这些数据中的 open high low close 数据
移动窗口数据计算
- windows 是窗口大小
更多推荐
已为社区贡献6条内容
所有评论(0)