
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
数据:某公司A,B产品在2018年1,2,3月的销量数据,数据格式为xlsximport numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.linear_model import LinearRegressionimport os% matplotlib inline1、批量读取数据,并输出以下信息(
Accent, Accent_r, Blues, Blues_r, BrBG, BrBG_r, BuGn, BuGn_r, BuPu, BuPu_r, CMRmap, CMRmap_r, Dark2, Dark2_r, GnBu, GnBu_r, Greens, Greens_r, Greys, Greys_r, OrRd, OrRd_r, Oranges, Oranges_r, PRGn, PR
气泡图与散点图使用的是同一个函数,这里对所涉及的参数进行补充说明。● text:列表,元素为相应节点的悬浮文字内容。● marker:数据节点参数,包括大小、颜色、格式等,有如下设置 项。➢ size:列表,元素为相应节点的尺寸大小。➢ sizeref:缩放的比例,如设置为2,则缩小为原来的1/2。➢ sizemode:缩放的标准,默认以 diameter(直径)缩放,也可选 择以 ar...
复购指标算法
from sklearn.datasets import make_circlesfrom sklearn.svm import SVCimport matplotlib.pyplot as pltfrom mpl_toolkits.mplot3d import Axes3Dfrom sklearn.linear_model import LogisticRegressionimport...
特征工程特征用户基本特征:获取基本的用户特征,基于用户本身属性多为类别特征的特点,对age,sex,usr_lv_cd进行独热编码操作,对于用户注册时间暂时不处理商品基本特征:根据商品文件获取基本的特征针对属性a1,a2,a3进行独热编码商品类别和品牌直接作为特征评论特征:分时间段,对评论数进行独热编码行为特征:分时间段对行为类别进行独热编码分别按照用户-...
数据挖掘流程:(一)数据读取:读取数据,并进行展示统计数据各项指标明确数据规模与要完成任务(二)特征理解分析单特征分析,逐个变量分析其对结果的影响多变量统计分析,综合考虑多种情况影响统计绘图得出结论(三)数据清洗与预处理对缺失值进行填充特征标准化/归一化筛选有价值的特征分析特征之间的相关性(四)建立模型特征数据与标签准备数据集切分多种建模算法对比集...
from sklearn.neighbors import KNeighborsClassifierfrom sklearn.model_selection import train_test_splitfrom sklearn.svm import SVCimport matplotlib.pyplot as pltimport numpy as nppath = "./knn_nu...
%matplotlib inlineimport numpy as npimport matplotlib.pyplot as pltfrom scipy import stats# use seaborn plotting defaultsimport seaborn as sns; sns.set()先训练一个基本的SVMfrom sklearn.svm import SVC...
# 导入相关包%matplotlib inline# 绘图包import matplotlibimport matplotlib.pyplot as pltimport numpy as npimport pandas as pd#定义文件名ACTION_201602_FILE = "data/JData_Action_201602.csv"ACTION_201603_FILE...







