logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据挖掘——预测未来销售

数据挖掘——预测未来销售处理sale_train_v2.csv和test.csv处理shop.csv处理item_categories.csv处理items.csv特征添加该项目来自kaggle比赛,处理sale_train_v2.csv和test.csv1、读取训练数据:test = pd.read_csv("./test.csv") .set_index("ID")train = p...

#机器学习
数据挖掘——关联规则算法之Apriori

数据挖掘——关联规则一、关联规则的基本概念二、强关联规则三、关联规则挖掘算法一、关联规则的基本概念设I=i1,i2,...,imI={i_{1},i_{2},...,i_{m}}I=i1​,i2​,...,im​为所有项目的集合,D为事务数据库,事务T是一个项目子集(T⊑IT\sqsubseteq IT⊑I)。每一个事务具有唯一的事务标识TID。设A是一个由项目构成的集合,称为项集。事务T包含..

数据挖掘——时间序列算法之ARMA模型

数据挖掘——时间序列算法之ARMA模型

数据挖掘项目——金融反欺诈

数据挖掘项目——金融反欺诈前言一、数据集获取二、特征工程1、读数据2、去除特殊字符3、删除属性4、提取标签三、构建模型前言该项目来自北风网,模型搭建很简单,该篇记录过程总结套路。一、数据集获取https://www.lendingclub.com/info/demand-and-credit-profile.action二、特征工程首先声明,该项目使用到的特征处理手段十分简单,但结果却...

数据挖掘——时间序列算法之MA模型

数据挖掘——时间序列算法之MA模型

数据挖掘——为什么使用哑变量?哑变量有哪些作用?哪些情况应该使用哑变量?

数据挖掘——为什么使用哑变量?哑变量有哪些作用?哪些情况应该使用哑变量?直接给链接:https://www.cnblogs.com/sddai/p/8834373.html

数据挖掘——关联规则算法之FP-tree

数据挖掘——关联规则算法之FP-tree前言FP-tree算法FP-tree的优缺点前言Apriori算法需要生成大量的候选集而且需要进行多次的扫描,对于那些大数据量的数据集很耗费时间。基于此问题,FP-tree算法不用生成候选集,只进行两次数据库扫描。简单来说是尽可能少得读取数据,尽可能的对读取到的数据进行压缩,属于空间换时间的算法。FP-tree算法FP-tree没有候选集,直接压缩数...

数据挖掘——时间序列算法之ARIMA模型

数据挖掘——时间序列算法之ARIMA模型

数据挖掘项目——新零售无人智能售货机商务数据分析

数据挖掘项目——新零售无人智能售货机商务数据分析一、 原始数据分析二、数据清洗1、处理附件12、处理附件2三、数据分析1、描述性分析2、数据可视化结果如下:一、 原始数据分析原数据中包含两个附件annex_1和annex_2。其中annex_1中有数据:订单号、设备ID、应付金额、实际金额、商品、支付时间、地点、状态、提现。具体如下:#原始数据detail = pd.read_csv('...

#数据挖掘#数据分析#人工智能
数据挖掘——时间序列算法之平滑法

数据挖掘——时间序列算法前言一、平滑法1、简述2、移动平均法2.1、简单移动平均2.2、加权移动平均法3、指数平滑法前言时间序列是许多数据挖掘任务重最常见的类型之一,同时也比较难处理。这篇记录下我所理解下的时间序列模型的算法。注意,这不是特征工程,而是算法(暂时是这样理解的,毕竟目前还没使用过这些方法做特征工程)。一、平滑法1、简述所谓时间序列平滑预测是指用平均的方法,把时间序列中的随机...

    共 42 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择