
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Python 当当网图书关注CSDN博客:程志伟的博客Python 3.7.6 (default, Jan 8 2020, 20:23:39) [MSC v.1916 64 bit (AMD64)]Type "copyright", "credits" or "license" for more information.IPython 7.12.0 -- An enhanced Interacti

关注微信公共号:小程在线关注CSDN博客:程志伟的博客视频地址:https://www.bilibili.com/video/BV1E4411B7ef?t=3&p=5...
关注微信公共号:小程在线关注CSDN博客:程志伟的博客测试 HDFS 是否具有过多副本不足块。不良 : 群集中有 1,814 个 副本不足的块 块。群集中共有 1,816 个块。百分比 副本不足的块: 99.89%。 临界阈值:40.00%。这是 HDFS 服务级运行状况测试,用于检查副本不足的块数是否未超过群集块总数的某一百分比。该运行状况测试失败可能表示 DataNode 丢失。使用 HDFS

关注微信公共号:小程在线关注CSDN博客:程志伟的博客1.1 文本编码技术简介1.1.1 单词计数向量在开始分类之前,我们必须先将文本编码成数字。一种常用的方法是单词计数向量。在这种技术中,一个样本可以包含一段话或一篇文章,这个样本中如果出现了10个单词,就会有10个特征(n=10),每个特征 代表一个单词,特征的取值 表示这个单词在这个样本中总共出现了几次,是一个离散的,代...
关注微信公共号:小程在线关注CSDN博客:程志伟的博客hive安装完成tez之后,运行程序还是报错。报错:OTHER_VERTEX_FAILURE]DAG did not succeed due to VERTEX_FAILURE. failedVertices:8 killedVertices:2解决方法:在hive-site的客户端高级配置里面添加下面的命令:hive.tez.containe

关注微信公共号:小程在线关注CSDN博客:程志伟的博客Python 3.7.6 (default, Jan 8 2020, 20:23:39) [MSC v.1916 64 bit (AMD64)]Type "copyright", "credits" or "license" for more information.IPython 7.12.0 -- An enhanced Interacti

关注微信公共号:小程在线整体数据关注CSDN博客:程志伟的博客6.1总的指标#6.1.1总GMV:约1.15亿元round(data['amount'].sum(),0)Out[4]: 114986636.0#6.1.2每月的GMV:#GMV8月之前都基本是处于上升状态,在7月8月的上升更是非常大,8月达到峰值,然后就开始下降了GMV_month = data.groupby('month').a

关注微信公共号:小程在线关注CSDN博客:程志伟的博客Python 3.7.6 (default, Jan 8 2020, 20:23:39) [MSC v.1916 64 bit (AMD64)]Type "copyright", "credits" or "license" for more information.IPython 7.12.0 -- An enhanced Interacti

关注微信公共号:小程在线关注CSDN博客:程志伟的博客#6.4.1结论先行'''广东、上海、北京的销售额、销量以及客户数量都是最高的销售额与销量1-8月呈上升趋势,但是8月份之后就开始下降618和双十一活动效果基本没有得到有效的回报,复盘一下618与双十一活动的内容。销售额与销量在5月、7月、8月有均有上升,这三个月的新客户都有增长,幅度也不少,证明拉新活动效果不错;9月份下降,加上9月份的新客户

关注微信公共号:小程在线整体数据关注CSDN博客:程志伟的博客6.1总的指标#6.1.1总GMV:约1.15亿元round(data['amount'].sum(),0)Out[4]: 114986636.0#6.1.2每月的GMV:#GMV8月之前都基本是处于上升状态,在7月8月的上升更是非常大,8月达到峰值,然后就开始下降了GMV_month = data.groupby('month').a
