
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
一、用线性回归找到最佳拟合直线回归的目的是预测数值型的目标值,即依据输入写出一个目标值的计算公式。这个公式就是所谓的回归方程,此处的HorsePower是我们要求的目标值,0.0015和-0.99就是回归方程的回归系数,annualSalary和hourListingToPublicRadio是计算目标值所需要输入的值。求这些回归系数的过程就是回归。给定输入X矩阵,回归系数存放...
从大规模数据集中寻找物品间的隐含关系被称作关联分析或者关联规则学习。一、关联分析频繁项集:经常出现在一块的集合。关联规则:按时两种物品之间可能存在很强的关系。支持度:一个项集的支持度被定义为数据集中包含该项集的记录所占的比例。可信度或置信度:是针对诸如{尿布}—>{葡萄酒}的关联规则来定义的,这条规则的可信度被定义为:支持度({尿布,葡萄酒})/支持度({尿布})支持...
一、实现目标(1)借助航空公司客户数据,对客户进行分类(2)对不同的客户进行特征分析,比较不同类客户的客户价值(3)对不同价值的客户类别提供个性化服务,指定相应的营销策略二、分析方法与过程航空客运信息挖掘主要步骤:(1)从航空公司的数据源进行选择性的抽取与新增数据抽取分别形成历史数据和增量数据(2)对步骤(1)中形成的两个数据集进行数据探索和预处理,包括数据缺失值与异常值的探索分析,数据的属性规
聚类是一种无监督的学习,它将相似的对象归到同一簇中,簇内的对象越相似,聚类的效果越好。K-均值聚类算法,它可以发现K个不同的簇,且每个簇的中心采用簇中所含值的均值计算而成。簇识别概念:假定有一些数据,现在将相似数据归到一起,簇识别会告诉我们这些簇到底都是些什么,聚类与分类的最大不同在于,分类的目标事先已知,而聚类则不一样。因为其产生的结果与分类相同,而只是类别没有预先定义,聚类有时也被称为无监..
背景:移动终端的普及,手机用户时间序列的手机定位数据,映射到现实的地理空间位置,即可完整、客观地还原出手机用户的现实活动轨迹,从而挖掘出人口空间分布与活动联系的特征信息。注:移动通信网络的信号覆盖逻辑上被设计成由若干六边形的基站小区相互邻接而构成的蜂窝网络面状服务区目标:(1)对用户的历史定位数据,采用数据挖掘技术,对基站进行分群。(2)对不同的商圈分群进行特征分析,比较不同商...







