logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Python 数据可视化:Stack Graph 堆叠图,标准化堆叠柱形图,标准化的同时还能反应数据量大小的堆叠图(放入自写库,一行代码搞定复杂细节绘图)

  这是一个自写库系列,即笔者在数据可视化路上踩过的坑的汇总,并自定义函数和传入参数来实现快速避坑 + 快速绘制出复杂精美的图片。引言  Python 的绘图功能非常强大,如果能将已有的绘图库和各种复杂操作汇总在一个自己写的库/包中,并实现一行代码就调用并实现复杂的绘图功能,那就更强大了。所以本博文只强调绘图代码的实现,绘图中的统计学知识(名义变量,数值变量,xx图与xx图的区别等等)与 ...

#数据分析#经验分享#数据可视化
【经典案例】 | 多元线性回归模型预测房价(附Python代码与数据)

经典案例,通用流程,还有注释详尽的源代码和源数据。

#python#数据分析
超详细!逻辑回归实现客户流失预警模型(含源数据)

???? 关注一下~,更多商业数据分析案例等你来撩利用逻辑回归进行客户流失预警建模中涵盖了许多比较细的知识点,思维导图只展示了极小的一部分,相关知识点链接将穿插在文中。本文已在公众号 " 数据分析与商业实践 " 首发,源数据和包含详细步骤和注释的源代码可空降文末。因为源代码中有一些自定义的长函数,直接放在文章中会非常占篇幅,而且阅读体验也不怎么好,而且分享有限,所以更多案例,操作,源数据可移步公众

#python#机器学习#数据分析 +1
Word 如何添加斜线表头(单/多斜线)

引言  熟练使用 Word,Excel 非常重要,写程序再厉害,也不可能每一份小数据都用程序处理吧,Excel 就派上了用场,将数据分析结果以图文形式呈现给他人,又或者是平时论文的撰写,无比需要使用 word,当然,你也可以直接 LaTeX 或者 Markdown。不过一句话,现在练起来吧,别等到写 毕业论文/上交业务 时才后悔没跟宿舍或公司的 Office 大神搞好关系。  Word 的技巧..

#经验分享#其他
Python文件操作----快速生成规律命名的大量文件,同时实现增删改查

写在前面今天在分类代码和整理文件时发现需要创建近100个文件夹,文件夹名呈规律性递增,如‘Question1-lv1’,‘Question2-lv1’, ‘Question(n)-lv1’, 这是问题数量的递增,然后便是问题等级的递增,Q1~Q30 为等级一类型,Q20~60为等级二,其余为等级三。在用鼠标点点点创建了5个文件以后,猛然醒悟:这样下去得创建到猴年马月,于是捣鼓了一下Python的.

Python 数据可视化:treemap 树形图 饼图升级版超详解,体现占比的同时显示出数量(放入自写库,一行代码搞定复杂细节绘图)

  这是一个自写库系列,即笔者在数据可视化路上踩过的坑的汇总,并自定义函数和传入参数来实现快速避坑 + 快速绘制出复杂精美的图片。引言  Python 的绘图功能非常强大,如果能将已有的绘图库和各种复杂操作汇总在一个自己写的库/包中,并实现一行代码就调用并实现复杂的绘图功能,那就更强大了。所以本博文只强调绘图代码的实现,绘图中的统计学知识(名义变量,数值变量,xx图与xx图的区别等等)与 ...

#python#数据分析#经验分享
Python 实现不平衡采样 | SMOTE,Tomek Link,SMOTETomek 综合采样

本文将基于不平衡数据,使用Python进行反欺诈模型数据分析实战,模拟分类预测模型中因变量分类出现不平衡时该如何解决,具体的案例应用场景除反欺诈外,还有客户违约和疾病检测等。只要是因变量中各分类占比悬殊,就可对其使用一定的采样方法,以达到除模型调优外的精度提升。主要将分为两个部分:原理介绍Python实战本文用到的数据与源代码可在公众号 “ 数据分析与商业实践 ” 后台回复 “ 反欺诈 ” 领取。

#python#机器学习#大数据 +1
R语言数据分析 -- 探索性数据分析基础练习

全文概述使用 RStudio 自带的钻石数据进行探索性数据分析练习:分析思路与作图练习导入钻石数据集library(ggplot2)data('diamonds')查看钻石数据集信息?diamondssummary((diamonds$color)) # 显示每个钻石颜色种类的数量情况一览价格分布summary(diamonds$price)# 基础预览qplot(x=...

#数据分析
到底了