
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
在平时的科研中,我们经常使用统计概率的相关知识来帮助我们进行城市研究。因此,掌握一定的统计概率相关知识非常有必要。本文将讨论我们经常遇到的概率分布,希望能从概念层面帮助大家建立总体认知。本文件涉及的概念包括:随机变量(Random Variable)密度函数(Density Functions)伯努利分布(Bernoulli Distribution)二项式分布(Binomial Distribu
来源:数据分析与统计学之美今天我们重新盘点66个Pandas函数合集,包括数据预览、数值数据操作、文本数据操作、行/列操作等等,涉及“数据清洗”的方方面面。Pandas 是基于NumPy的一种工具,该工具是为解决数据分析任务而创建的。它提供了大量能使我们快速便捷地处理数据的函数和方法。数据预览对于探索性数据分析来说,做数据分析前需要先看一下数据的总体概况。info()方法用来查看数据集信息,des
今天给大家分享一个klib库。klib提供了一系列非常易于应用的函数,具有合理的默认值,几乎可以用在任何DataFrame上,用于评估数据质量、获得灵感、执行数据清洗和可视化,从而更轻便、更高效的处理Python Pandas DataFrame数据。klib可视化数据-klib.cat_plot(df)#展示分类特征数量和频率-klib.corr_mat(df)#相关性矩阵-kl...
Edwin Jarvis | 作者cnblog博客 |来源在许多机器学习相关的书里,很难找到关于特征选择的内容,因为特征选择要解决的问题往往被视为机器学习的一个子模块,一般不会单独拿出...
许多数据可视化工作者都提到一件事,就是开发可视化作品变得更简单了,但是效果难以评估。本文翻译自toptal的博文,让我们来看看优秀的可视化实践是如何实现的吧。“杂乱无章和令人困惑不是数据...
开运张 | 作者知乎专栏 |来源https://zhuanlan.zhihu.com/p/55036520本篇文章在基础篇的基础上,选择实际案例进行了练习。再明确一次三个步骤:确定问题...
变量之间关系可以分为两类:函数关系:反映了事务之间某种确定性关系相关关系:两个变量之间存在某种依存关系,但二者并不是一一对应的;反映了事务间不完全确定关系;相关系数(r)可以衡量这种相关...
写在前面:本篇来源于书籍《数据之美—一本书学会可视化设计》的学习后整理所得。全篇主要围绕数据可视化的5个步骤展开,其中重点内容是第三步:“应该使用哪种可...
来自公众号:B座17楼由下面代码生成from chord import Chordmatrix = [[0, 5, 6, 4, 7, 4],[5, 0, 5, 4, 6, 5],[6, 5, 0, 4, 5, 5],[4, 4, 4, 0, 5, 5],[7, 6, 5, 5, 0, 4],[4, 5, 5...
作者丨Slava Shestopalov来源丨MicroUX链接丨https://medium.muz.li/dataviz-sins-976f3a08948c大家好,我是1480君蛇形...







