logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习实战—预测数值型数据:回归

一、用线性回归找到最佳拟合直线回归的目的是预测数值型的目标值,即依据输入写出一个目标值的计算公式。这个公式就是所谓的回归方程,此处的HorsePower是我们要求的目标值,0.0015和-0.99就是回归方程的回归系数,annualSalary和hourListingToPublicRadio是计算目标值所需要输入的值。求这些回归系数的过程就是回归。给定输入X矩阵,回归系数存放...

#线性回归
机器学习实战—使用Apriori算法进行关联分析

从大规模数据集中寻找物品间的隐含关系被称作关联分析或者关联规则学习。一、关联分析频繁项集:经常出现在一块的集合。关联规则:按时两种物品之间可能存在很强的关系。支持度:一个项集的支持度被定义为数据集中包含该项集的记录所占的比例。可信度或置信度:是针对诸如{尿布}—>{葡萄酒}的关联规则来定义的,这条规则的可信度被定义为:支持度({尿布,葡萄酒})/支持度({尿布})支持...

数据挖掘实例(航空公司客户价值分析)

一、实现目标(1)借助航空公司客户数据,对客户进行分类(2)对不同的客户进行特征分析,比较不同类客户的客户价值(3)对不同价值的客户类别提供个性化服务,指定相应的营销策略二、分析方法与过程航空客运信息挖掘主要步骤:(1)从航空公司的数据源进行选择性的抽取与新增数据抽取分别形成历史数据和增量数据(2)对步骤(1)中形成的两个数据集进行数据探索和预处理,包括数据缺失值与异常值的探索分析,数据的属性规

#数据挖掘
机器学习实战—K-均值聚类算法

聚类是一种无监督的学习,它将相似的对象归到同一簇中,簇内的对象越相似,聚类的效果越好。K-均值聚类算法,它可以发现K个不同的簇,且每个簇的中心采用簇中所含值的均值计算而成。簇识别概念:假定有一些数据,现在将相似数据归到一起,簇识别会告诉我们这些簇到底都是些什么,聚类与分类的最大不同在于,分类的目标事先已知,而聚类则不一样。因为其产生的结果与分类相同,而只是类别没有预先定义,聚类有时也被称为无监..

数据挖掘实例(基于基站定位数据的商圈分析)

背景:移动终端的普及,手机用户时间序列的手机定位数据,映射到现实的地理空间位置,即可完整、客观地还原出手机用户的现实活动轨迹,从而挖掘出人口空间分布与活动联系的特征信息。注:移动通信网络的信号覆盖逻辑上被设计成由若干六边形的基站小区相互邻接而构成的蜂窝网络面状服务区目标:(1)对用户的历史定位数据,采用数据挖掘技术,对基站进行分群。(2)对不同的商圈分群进行特征分析,比较不同商...

#scipy#sklearn#matplotlib
深度学习基础(一)

一、深度学习介绍1.概念:深度学习是基于机器学习延伸出来的一个新的领域,由以热大脑结构为启发的神经网络算法为起源加之模型结构深度的增加发展,并伴随大数据和计算机能力的提高而产生的一系列新的算法。深度学习主要用于机器语言的识别领域二、深度学习的应用1.无人驾驶汽车的路标识别2.谷歌中的语音识别3.百度识图,以图识图4.针对图片,自动生成对图片的描述

#深度学习#神经网络#大数据 +1
到底了