
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
这是一个自写库系列,即笔者在数据可视化路上踩过的坑的汇总,并自定义函数和传入参数来实现快速避坑 + 快速绘制出复杂精美的图片。引言 Python 的绘图功能非常强大,如果能将已有的绘图库和各种复杂操作汇总在一个自己写的库/包中,并实现一行代码就调用并实现复杂的绘图功能,那就更强大了。所以本博文只强调绘图代码的实现,绘图中的统计学知识(名义变量,数值变量,xx图与xx图的区别等等)与 ...
经典案例,通用流程,还有注释详尽的源代码和源数据。
???? 关注一下~,更多商业数据分析案例等你来撩利用逻辑回归进行客户流失预警建模中涵盖了许多比较细的知识点,思维导图只展示了极小的一部分,相关知识点链接将穿插在文中。本文已在公众号 " 数据分析与商业实践 " 首发,源数据和包含详细步骤和注释的源代码可空降文末。因为源代码中有一些自定义的长函数,直接放在文章中会非常占篇幅,而且阅读体验也不怎么好,而且分享有限,所以更多案例,操作,源数据可移步公众
引言 熟练使用 Word,Excel 非常重要,写程序再厉害,也不可能每一份小数据都用程序处理吧,Excel 就派上了用场,将数据分析结果以图文形式呈现给他人,又或者是平时论文的撰写,无比需要使用 word,当然,你也可以直接 LaTeX 或者 Markdown。不过一句话,现在练起来吧,别等到写 毕业论文/上交业务 时才后悔没跟宿舍或公司的 Office 大神搞好关系。 Word 的技巧..
写在前面今天在分类代码和整理文件时发现需要创建近100个文件夹,文件夹名呈规律性递增,如‘Question1-lv1’,‘Question2-lv1’, ‘Question(n)-lv1’, 这是问题数量的递增,然后便是问题等级的递增,Q1~Q30 为等级一类型,Q20~60为等级二,其余为等级三。在用鼠标点点点创建了5个文件以后,猛然醒悟:这样下去得创建到猴年马月,于是捣鼓了一下Python的.
这是一个自写库系列,即笔者在数据可视化路上踩过的坑的汇总,并自定义函数和传入参数来实现快速避坑 + 快速绘制出复杂精美的图片。引言 Python 的绘图功能非常强大,如果能将已有的绘图库和各种复杂操作汇总在一个自己写的库/包中,并实现一行代码就调用并实现复杂的绘图功能,那就更强大了。所以本博文只强调绘图代码的实现,绘图中的统计学知识(名义变量,数值变量,xx图与xx图的区别等等)与 ...
原理简单,实现优雅,效果拔群
本文将基于不平衡数据,使用Python进行反欺诈模型数据分析实战,模拟分类预测模型中因变量分类出现不平衡时该如何解决,具体的案例应用场景除反欺诈外,还有客户违约和疾病检测等。只要是因变量中各分类占比悬殊,就可对其使用一定的采样方法,以达到除模型调优外的精度提升。主要将分为两个部分:原理介绍Python实战本文用到的数据与源代码可在公众号 “ 数据分析与商业实践 ” 后台回复 “ 反欺诈 ” 领取。
原理简单,实现优雅,效果拔群
全文概述使用 RStudio 自带的钻石数据进行探索性数据分析练习:分析思路与作图练习导入钻石数据集library(ggplot2)data('diamonds')查看钻石数据集信息?diamondssummary((diamonds$color)) # 显示每个钻石颜色种类的数量情况一览价格分布summary(diamonds$price)# 基础预览qplot(x=...







