简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
目录1.背景2.分析目标3.数据准备4.数据清洗4.1查看是否含有缺失值4.2查看是否有异常值4.3数据整理5.具体目标分析5.1分析每年销售额的增长率5.2各个地区分店的销售额5.3销售淡旺季分析5.4新老客户数5.5用户价值度RFM模型分析6.案例结论6.1结论依据6.2案例结论1.背景随着电商的不断发展,网上购物变得越来越流行。更多电商平台崛起,对于电商卖家来说增加的不只是人们越来越高的需求
66.加一给定一个由 整数 组成的 非空 数组所表示的非负整数,在该数的基础上加一。最高位数字存放在数组的首位, 数组中每个元素只存储单个数字。你可以假设除了整数 0 之外,这个整数不会以零开头。代码①:用Python中列表与字符串、整数相互转化def plusOne(digits):string = ''for i in digits:string = string +str(i)num = s
1 算法简介K近邻算法(英文为K-Nearest Neighbor,因而又简称KNN算法)是非常经典的机器学习算法。K近邻算法的原理非常简单:对于一个新样本,K近邻算法的目的就是在已有数据中寻找与它最相似的K个数据,或者说“离它最近”的K个数据,如果这K个数据大多数属于某个类别,则该样本也属于这个类别。(K的含义)以下图为例,假设五角星代表爱情片,三角形代表科幻片。此时加入一个新样本正方形,需要判
目录1 多元线性回归简介2 案例:客户价值预测模型2.1 案例背景2.2具体代码3模型评估参考书籍1 多元线性回归简介多元线性回归模型可以表示为如下所示的公式。其中x1、x2、x3……为不同的特征变量,k1、k2、k3……则为这些特征变量前的系数,k0为常数项。2 案例:客户价值预测模型利用多元线性回归模型可以根据多个因素来预测客户价值,当模型搭建完成后,便可对不同价值的客户采用不同的业务策略。2
目录1 一元线性回归简介2 一元线性回归数学形式3案例:不同行业工龄与薪水的线性回归模型3.1案例背景3.2具体代码3.3模型优化4总体展示5线性回归模型评估6模型评估的数学原理6.1 R-squared6.2Adj.R-squared6.3 P值参考书籍1 一元线性回归简介线性回归模型是利用线性拟合的方式探寻数据背后的规律。如下图所示,先通过搭建线性回归模型寻找这些散点(也称样本点)背后的趋势线
1 朴素贝叶斯的算法原理贝叶斯分类是机器学习中应用极为广泛的分类算法之一。朴素贝叶斯是贝叶斯模型当中最简单的一种,其算法核心为如下所示的贝叶斯公式。其中P(A)为事件A发生的概率,P(B)为事件B发生的概率,P(A|B)表示在事件B发生的条件下事件A发生的概率,同理P(B|A)则表示在事件A发生的条件下事件B发生的概率。举一个简单的例子:已知冬季一个人感冒(事件A)的概率P(A)为40%,一个人打
1 集成模型简介集成学习模型使用一系列弱学习器(也称为基础模型或基模型)进行学习,并将各个弱学习器的结果进行整合,从而获得比单个学习器更好的学习效果。集成学习模型的常见算法有Bagging算法和Boosting算法两种。Bagging算法的典型机器学习模型为随机森林模型,而Boosting算法的典型机器学习模型则为AdaBoost、GBDT、XGBoost和LightGBM模型。1.1 Baggi
1 简介逻辑回归也被称为广义线性回归模型,它与线性回归模型的形式基本上相同,最大的区别就在于它们的因变量不同,如果是连续的,就是多重线性回归;如果是二项分布,就是Logistic回归。Logistic回归虽然名字里带“回归”,但它实际上是一种分类方法,主要用于二分类问题(即输出只有两种,分别代表两个类别),也可以处理多分类问题。线性回归是用来预测连续变量的,其取值范围(-∞,+∞),而逻辑回归模型
目录1 决策树模型简介2 Gini系数(CART决策树)3信息熵、信息增益4决策树模型代码实现4.1分类决策树模型(DecisionTreeClassifier)4.2回归决策树模型(DecisionTreeRegressor)5案例:员工离职预测模型5.1模型搭建5.1.1数据读取与预处理5.1.2提取特征变量和目标变量5.1.3划分训练集与测试集5.1.4模型搭建及训练5.1.5代码汇总5.2
目录1 决策树模型简介2 Gini系数(CART决策树)3信息熵、信息增益4决策树模型代码实现4.1分类决策树模型(DecisionTreeClassifier)4.2回归决策树模型(DecisionTreeRegressor)5案例:员工离职预测模型5.1模型搭建5.1.1数据读取与预处理5.1.2提取特征变量和目标变量5.1.3划分训练集与测试集5.1.4模型搭建及训练5.1.5代码汇总5.2