记录数据分析的过程。儿童视力数据
最近,我分析了一个孩子的视力数据并记录下来。需要数据的小伙伴可以下载。 将 numpy 导入为 np 将熊猫导入为 pd 导入 matplotlib.pyplot 作为 plt 进口重新 导入我们 将 seaborn 导入为 sns 将 scipy.stats 导入为 ss plt.rcParams['font.family'] u003d ['SimHei'] plt.rcParams['axe
最近,我分析了一个孩子的视力数据并记录下来。需要数据的小伙伴可以下载。
将 numpy 导入为 np
将熊猫导入为 pd
导入 matplotlib.pyplot 作为 plt
进口重新
导入我们
将 seaborn 导入为 sns
将 scipy.stats 导入为 ss
plt.rcParams['font.family'] u003d ['SimHei']
plt.rcParams['axes.unicode_minus'] u003d False
res_dir u003d "E:\同事\眼科\\使用\安排\\res_dir_yanke"
df u003d pd.read_excel(os.path.join(res_dir, "noNullSex_8783.xlsx"))
df.shape
df.keys()
共有 8783 条数据。变量是:
年级、班级、姓名、性别、出生年月、右眼视力、左眼视力、右检眼镜s、右检眼镜c、右检眼镜a、左检眼镜s、左检眼镜c、左检眼镜a、视力是否差、学校阶段(分为幼儿园、小学和初中)
# 先替换名称部分。为保护隐私,更换中间部分。
name2 u003d [ re.sub(r'(\w)(\w)', r'\1*', x) for x in df['name'] ]
名称2
df['name'] u003d name2
df['名称']
df.info()
基本资料齐全。在左右眼的数据中,缺少一些视力。右眼有 8777 个有效数据,左眼有 8779 个有效数据。因为两只眼睛是主要数据,所以基本视力一定是。删除缺失的。
df u003d df.dropna(子集 u003d ['left', 'right'])
df.shape
df[['right', 'left']].describe()
这是所有的基本信息。
首先,您可以分组查看。意思是。
df['type'].value_counts()
小学6780所,幼儿园1249所,初中748所
每组的平均值是多少。
df.groupby('type')['right', 'left'].mean()
可见幼儿园孩子的视力是最好的。初中时,他们的视力基本下降到4.5左右。都是近视。
当然,你也可以看看初中的数据分布情况。
df[df['type'] u003du003d "中间"]['right'].describe()
仅从右眼来看,初中生的中位数是4.4。四分之一的学生视力低于4.0。
在视力方面,有以下标准:
1\。视力差是指左眼和右眼中任意一只眼的视力低于5.0,即使视力差。
2\。近视,左右眼视力小于5.0,单眼球面镜a数据小于-0.5。即使近视大于正数,也是远视。这里仅以近视为例。
首先生成一个视力不佳的变量来判断是否有一只眼睛的视力低于5.0。
df['sight_impaired'] u003d (df['right'] < 5.0 ) | (df['left'] < 5.0 )
df['视力\受损'].value_counts()
可以看出,其中近一半的人视力不佳。
但也有很多幼儿园的孩子视力不好。不信可以分组看看。
df.groupby('type')['sight_impaired'].value_counts(normalizeu003dTrue).unstack()
地方['年纪].value_counts()
df.groupby('nianji')['sight_impaired'].value_counts(normalizeu003dTrue).unstack()
地方['年纪].unique()
nianji_order u003d ['托班','接待班','中班','大班','一年级','二年级','三年级','四年级','五年级'、'初一'、'初三'、'初二'、'初四']
x u003d df.groupby('nianji')['sight_impaired'].value_counts(normalizeu003dTrue).unstack()
x
x.reindex(年记_order)[真]
x.reindex(年记_order)[真].plot()
研究发现,幼儿园儿童视力不佳的比例很高。事实上,这是因为大多数幼儿园的孩子都是远视的。当他们长大后,他们的视力就会恢复正常。比如一年级的孩子视力基本是5.0,没问题,但是年级越高,视力差的比例就越高,初四接近100%。几乎是近视。幼儿园和初中虽然都在搞,但是是完全不同的两所高中。
从近视的比例可以看出。
这使用了先前的近视标准。
左右眼视力均在5.0以下,球面镜s值小于-0.5。需要生成一个变量。如果满足这些条件,则确定为True,否则为False
更多推荐
所有评论(0)