
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文是基于《Python数据分析与挖掘实战》的实战部分的第14章的数据——《基于基站定位数据的商圈分析》做的分析。旨在补充原文中的细节代码,并给出文中涉及到的内容的完整代码。在作者所给代码的基础上增加的内容包括: 1)探索了不同的method取值而画出的谱系聚类图的不同1 挖掘背景及目标 从某通信运营商提供的特定接口解析得到用户的定位数据。利用基站小区的覆盖范围作为商圈区域的划分,归纳出商圈
本文是基于《Python数据分析与挖掘实战》的实战部分的第12章的数据——《电子商务网站用户行为分析及服务推荐》做的分析。由于此章内容很多,因此,分为三个部分进行分享——数据探索(上)、数据预处理(中)、模型构建(下)本文是继前一篇文章,进行的工作。本文是“数据预处理(中)”部分1 数据清洗1.1 查看各个需要删除的规则包含的信息# 删除规则1:统计中间类型网页(带midques_关键字)#
本文是基于《Python数据分析与挖掘实战》的实战部分的第七章的数据——《航空公司客户价值分析》做的分析。旨在补充原文中的细节代码,并给出文中涉及到的内容的完整代码。 1)在数据预处理部分增加了属性规约、数据变换的代码2)在模型构建的部分增加了一个画出雷达图的函数代码1 背景与目标分析 此项目旨在根据航空公司提供的数据,对其客户进行分类,并且比较不同类别客户的价值,为能够更好的为客户提供个性
本文中案例以【利用python进行数据分析——基础篇】利用Python处理和分析Excel表中数据实战的实战数据为例备注:本文操作是使用ipython notebook进行的编译# 将DataFrame表中的浮点类型保留至小数点后四位# 自定义函数保留到小数点后四位f = lambda x: '%.4f' % x# 将aa 表的第21列到末尾的列的数据格式都保留到小数点后四位aa.ix[:,21:
比如当前的表格数据是df['resultRate'].plot(style='-.bo')plt.grid(axis='y')#设置数字标签**for a,b in zip(df['num'],df['resultRate']):plt.text(a, b+0.001, '%.4f' % b, ha='center', va= 'bottom',fontsize=9)plt.s...
本文是基于《Python数据分析与挖掘实战》的实战部分的第11章的数据——《应用系统负载分析与磁盘容量预测》做的分析。旨在补充原文中的细节代码,并给出文中涉及到的内容的完整代码;在作者所给代码的基础上增加的内容包括: 1)数据探索时画C盘/D盘已使用空间的时序图,并根据自相关和偏相关图判定平稳性,确定了所用模型是采用ARMA或者ARIMA,而不是AR或者MA;2)模型构建构建基于ARIMA或者A







