箱状图理解
·
参考:
箱形图(英文:Box plot),又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。其于1977年由美国著名统计学家约翰·图基(John Tukey)发明。它能显示出一组数据的最大值、最小值、中位数、及上下四分位数。
基本参数
下面我们以一个实际的箱状图为例,说明其中的常用参数。
- 上/下边缘:图中上下两个短横线,代表统计数据的最大值与最小值。
- 中位数:顾名思义,代表统计数据的中位数,相对于均值对噪声的影响不明显,所以更加常用。
- 下四分位数:即数据中25%的值小于该值。
- 上四分位数:即数据中75%的值小于该值。
属性
- 当箱形图很短时,这意味着大部分数据点都相似,因为大多数值在在很小的范围内
- 当箱形图很高时,这意味着大部分数据点都非常不同,因为这些值分布在很广的范围内
- 如果中值接近底部,那么我们知道大多数数据具有较低的值。如果中值接近顶部,那么我们知道大多数数据具有更高的值。所以,如果中值的线不在框的中间,则表明数据分布不均匀。
- 是否有长尾? 如果有长尾,这意味着数据具有较高的标准偏差和方差,即数值分散且变化很大。如果盒子的一侧有须,而另一侧没有,那么统计数据可能只在一个方向上变化很大。
推荐内容
更多推荐
相关推荐
查看更多
llama_index

LlamaIndex(前身为GPT Index)是一个用于LLM应用程序的数据框架
halo

强大易用的开源建站工具。
freeCodeCamp

freeCodeCamp.org的开源代码库和课程。免费学习编程。
热门开源项目
活动日历
查看更多
直播时间 2025-04-25 15:00:00


直播时间 2025-04-23 19:00:00

GitTalk:国内首个微服务编排框架Juggle实战解析
直播时间 2025-04-22 18:31:56

字节AI 黑科技!从 Manus Agent 入门 Eino
直播时间 2025-04-09 14:34:18

樱花限定季|G-Star校园行&华中师范大学专场
直播时间 2025-04-07 14:51:20

樱花限定季|G-Star校园行&华中农业大学专场
目录
所有评论(0)