
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Accent, Accent_r, Blues, Blues_r, BrBG, BrBG_r, BuGn, BuGn_r, BuPu, BuPu_r, CMRmap, CMRmap_r, Dark2, Dark2_r, GnBu, GnBu_r, Greens, Greens_r, Greys, Greys_r, OrRd, OrRd_r, Oranges, Oranges_r, PRGn, PR
气泡图与散点图使用的是同一个函数,这里对所涉及的参数进行补充说明。● text:列表,元素为相应节点的悬浮文字内容。● marker:数据节点参数,包括大小、颜色、格式等,有如下设置 项。➢ size:列表,元素为相应节点的尺寸大小。➢ sizeref:缩放的比例,如设置为2,则缩小为原来的1/2。➢ sizemode:缩放的标准,默认以 diameter(直径)缩放,也可选 择以 ar...
复购指标算法
from sklearn.datasets import make_circlesfrom sklearn.svm import SVCimport matplotlib.pyplot as pltfrom mpl_toolkits.mplot3d import Axes3Dfrom sklearn.linear_model import LogisticRegressionimport...
特征工程特征用户基本特征:获取基本的用户特征,基于用户本身属性多为类别特征的特点,对age,sex,usr_lv_cd进行独热编码操作,对于用户注册时间暂时不处理商品基本特征:根据商品文件获取基本的特征针对属性a1,a2,a3进行独热编码商品类别和品牌直接作为特征评论特征:分时间段,对评论数进行独热编码行为特征:分时间段对行为类别进行独热编码分别按照用户-...
数据挖掘流程:(一)数据读取:读取数据,并进行展示统计数据各项指标明确数据规模与要完成任务(二)特征理解分析单特征分析,逐个变量分析其对结果的影响多变量统计分析,综合考虑多种情况影响统计绘图得出结论(三)数据清洗与预处理对缺失值进行填充特征标准化/归一化筛选有价值的特征分析特征之间的相关性(四)建立模型特征数据与标签准备数据集切分多种建模算法对比集...
from sklearn.neighbors import KNeighborsClassifierfrom sklearn.model_selection import train_test_splitfrom sklearn.svm import SVCimport matplotlib.pyplot as pltimport numpy as nppath = "./knn_nu...
%matplotlib inlineimport numpy as npimport matplotlib.pyplot as pltfrom scipy import stats# use seaborn plotting defaultsimport seaborn as sns; sns.set()先训练一个基本的SVMfrom sklearn.svm import SVC...
# 导入相关包%matplotlib inline# 绘图包import matplotlibimport matplotlib.pyplot as pltimport numpy as npimport pandas as pd#定义文件名ACTION_201602_FILE = "data/JData_Action_201602.csv"ACTION_201603_FILE...
用户画像-案例基于用户搜索关键词数据为用户打上标签(年龄,性别,学历)整体流程(一)数据预处理编码方式转换对数据搜索内容进行分词词性过滤数据检查(二)特征选择建立word2vec词向量模型对所有搜索数据求平均向量(三)建模预测不同机器学习模型对比堆叠模型将原始数据转换成utf-8编码,防止后续出现各种编码问题由于原始数据比较大,在分词与过滤阶段会比较慢,这...







