2010年第六次人口普查微观数据库为中国2010年人口普查原始个体样本数据。2010年人口普查采用了长、短两种普查表,短表包括反映人口基本状况的项目,长表包括所有短表项目和人口的经济活动、婚姻家庭、生育和住房等情况的项目。长表抽取了10%的户填报,短表由其余的户填报。本数据库是对普查表长表数据进行系统抽样获得,抽样比为0.995%,占总人口(不包含现役军人和难以确定常住地的人口)的比重为0.95‰。

数据库包括户记录405660条,人记录1267381条。数据的主要结构指标对总体具有较好的代表性,能够满足大多数研究的需要。 数据库使用常住人口口径。数据指标涵盖性别、年龄、民族、户籍情况、受教育程度、行业、就业、迁移流动、社会保障、婚姻、生育、死亡、住房情况等59个相关指标。为防止个人特征的泄漏,数据库已进行匿名化处理,删除了能够辨识到住户以至个人的信息,屏蔽了个别变量的极端值,请用户在使用时注意。

数据变量和样本量

year vars sample

2000 79 1,180,111

2005 90 2,585,481

2010 59 1,267,381

2015 60 1,371,252

更多推荐