
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
文章目录一. 命名规范二. 库表基础规范三. 字段规范四. 索引规范五. SQL设计一、正规化表设计原则二、SQL设计六. 行为规范一. 命名规范1.库名、表名、字段名必须使用小写字母,并采用下划线分割(1)MySQL有配置参数lower_case_table_names=1,即库表名以小写存储,大小写不敏感。如果是0,则库表名以实际情况存储,大小写敏感;如果是2,以实际情况存储,但以小写比较。(
文章目录明确问题理解数据处理数据异常值处理标签处理新增计算列数据分析分析思路描述性分析探索性分析送达总时长时间过长,导致的差评骑手个人行为导致的差评商户行为导致的差评其他评价标签的白描建议明确问题美团骑手出现差评的原因是什么?影响因素是哪些?并给出改善方案。(骑手姓名重复默认为同一个骑手;同一个骑手可能在不同站点出现差评)数据时间:无;数据地点:站点A-E;核心业务指标:顾客配送评分;比较对象:差
文章目录基础添加自定义词典实战基础jieba.cut 方法接受三个输入参数: 需要分词的字符串;cut_all 参数用来控制是否采用全模式;HMM 参数用来控制是否使用 HMM 模型jieba.cut_for_search 方法接受两个参数:需要分词的字符串;是否使用 HMM 模型。该方法适合用于搜索引擎构建倒排索引的分词,粒度比较细待分词的字符串可以是 unicode 或 UTF-8 字符串、G
文章目录数据预处理思路1. 标准化:去均值,方差规模化数据预处理思路1.首先要明确有多少特征,哪些是连续的,哪些是类别的。2.检查有没有缺失值,对确实的特征选择恰当方式进行弥补,使数据完整。3.对连续的数值型特征进行标准化,使得均值为0,方差为1。4.对类别型的特征进行one-hot编码。5.将需要转换成类别型数据的连续型数据进行二值化。6.为防止过拟合或者其他原因,选择是否要将数据...
文章目录明确问题理解数据处理数据异常值处理标签处理新增计算列数据分析分析思路描述性分析探索性分析送达总时长时间过长,导致的差评骑手个人行为导致的差评商户行为导致的差评其他评价标签的白描建议明确问题美团骑手出现差评的原因是什么?影响因素是哪些?并给出改善方案。(骑手姓名重复默认为同一个骑手;同一个骑手可能在不同站点出现差评)数据时间:无;数据地点:站点A-E;核心业务指标:顾客配送评分;比较对象:差
文章目录理解数据含义确定需要解决的问题根据问题新建度量值确定背景、主题、字体及字体大小结果展示理解数据含义本次可视化共有四张表,根据数据说明文档选择自己需要的特征,不需要的数据列隐藏。确定需要解决的问题根据问题新建度量值确定背景、主题、字体及字体大小结果展示...
文章目录回归定义最常用回归方法一、线性回归(Linear Regression)二、逻辑回归(Logistic Regression)回归定义回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。使用曲线/线来拟合这些数据点,在这种方式下,从曲线或线到数据点的距离差异最小。最常用回归方法一、...







