logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

用餐饮客户消费数据进行K-Means算法实战

概念对于连续属性,要先进行零-均值规范,在进行距离的计算。在K-Means算法中,一般需要度量样本间的距离,样本与簇之间的距离以及簇与簇之间的距离数据现在有部分餐饮客户的消费数据见表方法R表示最近一次消费时间间隔,F表示消费频率,M表示消费总金额。采用K-Means聚类算法,设定聚类个数为3,最大迭代次数为3,距离函数只能采用欧式距离代码与解释# -*- coding: utf-8 -*-

#数据分析
python3使用代理ip访问指定网站

首先要找一个可以提供代理ip的网站,然后爬下网站上的ip地址和端口号。最后用爬取出来的ip做代理访问指定网站。关键地方我用红色箭头标注出来了。分页解析代码如下def getProxyIp():proxy = []for i in range(1, 3):print(i)header = {'User-Agent': 'Mozilla/

#爬虫#python
Pyhton数据挖掘-电力窃漏电用户的自动识别

概述本来主要是对博主在Python数据分析与挖掘实战的上第六章实践过程中所出现问题的总结,看本文的之前最好是看过这本书的第六章。问题一:采用anaconda环境下安装tensorFlow后,pycharm识别不了TensorFlow。情况是这样的,博主在首先安装好tensorFlow后,再安装keras成功后,pycharm识别不了TensorFlow。然后设置python解析器路径,如图:

#pycharm#tensorflow#数据分析
到底了