中国产业结构转型过程中劳动市场性别差异之谜
上QQ阅读APP看书,第一时间看更新

第三节 本书使用数据说明

一 世界发展指数数据库

世界发展指数数据库是世界银行负责开发和整理的,该数据库涵盖了世界绝大多数国家(214个国家),并整理了根据地理位置和收入水平分类的加总数据,如整个亚洲地区、整个中高等收入国家总和等。世界发展指数数据库的指标主要有教育、环境、经济政策和负债、金融和财政、健康、基础设施、劳动和社会保障、贫困、私有部门和贸易以及公共部门等方向的数据。本书利用到的服务业份额数据和劳动参与率数据分别来源于经济政策和负债以及劳动和社会保障。

二 人口普查数据

本书会用到1982年的第三次人口普查数据、1990年的第四次人口普查数据、2000年的第五次人口普查数据和2010年的第六次人口普查数据。人口普查是指在国家统一规定的时间内,按照统一的方法、统一的项目、统一的调查表和统一的标准时点,对全国人口普遍地、逐户逐人进行的一次性调查登记。人口普查工作包括对人口普查资料的搜集、数据汇总、资料评价、分析研究、编辑出版等全部过程,它是当今世界各国广泛采用的搜集人口资料的一种最基本的科学方法,是提供全国基本人口数据的主要来源。从1949年至今,中国分别在1953年、1964年、1982年、1990年、2000年与2010年进行过六次全国性人口普查。以第六次人口普查为例,全国人口普查采取全员制普查,也就是说普查涉及每个家庭和个人,做到调查员入户调查,且涉及性别、年龄、婚姻、住房、就业和迁移等多个方面。本书利用的劳动参与率数据来源于人口普查就业方面的数据。

三 中国健康与营养调查数据库

中国健康与营养调查数据库(CHNS)来自中国疾病预防控制中心营养与食品安全所(原中国预防医学科学院营养与食品卫生研究所)与美国北卡罗来纳大学人口中心合作的追踪调查项目,其目的在于探讨中国社会的经济转型和计划生育政策的开展对国民健康和营养状况的影响。该调查始于1989年,截至目前共进行了9次,范围覆盖了9个省的城市和农村地区,内容涉及人口特征、经济发展、公共资源和健康指标。除此之外,还有详细的社区数据,包括食品市场、医疗机构和其他社会服务设施的信息。上面这些特点使CHNS具有独特的应用价值。除此之外,CHNS数据还报告了个人的就业和工资等劳动市场信息,对本书的研究提供了跨越20多年的大样本微观数据。

该调查采用多阶段分层整群随机抽样方法,具体步骤如下:第一步,在中国的东部、中部、西部地区采用简单随机抽样方法共抽取9个省作为第一层级进行调查。第二步,按照收入等级(低、中、高)将各省的县进行分层,并根据一个权重样本表随机抽取9个省的4个县(1个高收入县、2个中等收入县和1个低收入县)作为农村样本(共抽取了36个县),各县除县城外再随机抽取3个村,分别代表该县的高、中、低三个收入层次(共抽取了108个乡村);抽取每个省的省会和一个低收入城市作为城市样本,各城市的市区(共抽取了41个市区)和郊区(共抽取了38个郊区)随机抽取。第三步,对抽取的城市和农村样本再按照简单随机抽样的方法共抽取220个社区样本,再从每个社区抽取约20个家庭住户进行入户调查,共得到约4400个家庭住户、19000个个人样本。

四 2005年的1%人口抽样调查数据

2005年的1%人口抽样调查的每个省市按照国家统计局分配的样本数量和调查原则,组织实施抽样调查。实际调查样本约占全国人口的1.31%。国家统计局从这些调查样本(约1698.6万人)中,按照简单随机抽样的方法抽取1/5的样本提供给研究机构。本书使用2005年抽样调查数据的观测样本约为258万人。2005年的1%人口抽样调查数据包括两个部分,即家庭数据和个人数据。家庭数据包括了家庭地址、户别、家庭住房情况等数据;个人数据包括了与户主关系、性别、年龄、上学和受教育水平等人口特征变量,是否工作、工作职业和工资等工作变量。鉴于2005年的1%人口抽样调查数据对个人工作情况的详细说明以及其横截面样本量巨大的特点,可以用来研究女性的劳动参与率和性别工资差异这两个问题,并能充分反映中国的基本情况。

五 流动人口数据

2012年流动人口数据是计划生育委员会2012年组织调查的流动人口数据。该数据对2011年接受调查的家庭户、社区和县(或乡镇)进行基本信息、人口流动迁移的特点、留守家庭生存发展状况、当地社会经济和资源环境基本信息等追踪了解。另外,该数据补充了对以喀斯特地貌地区、东北边境地区、西南少数民族地区流动人口相关情况为主题的调查。该数据追踪调查采取家庭问卷、社区问卷、报表方式收集相关信息,一次性调查采取社区问卷、报表方式收集相关信息。另外,该数据囊括了15万个左右的观测值,也包含了劳动参与率和月工资等变量,因此利于本书研究家庭视角下人口流动对女性劳动参与率和性别工资差异的影响。

六 农业部农村固定观察点数据

农业部农村固定观察点办公室的调查数据(RCRE数据)包括从2003年到2006年对中国各省众多农村家庭各种经济指标的全面调查信息。RCRE数据库分为八个部分,其中包括家庭类型、家庭成员基本情况及劳动和收入信息、土地情况、产出投入信息、固定资产和家庭全年收支等。另外,数据库中有包含调查农户所在村的基本信息。本书的研究涉及村基本信息变量、家庭类型、家庭成员务工信息和家庭收入信息四部分。

本书除了用到这些主要数据以外,一些数据还来自各年的《中国统计年鉴》《中国人口年鉴》《中国第三产业年鉴》等。另外,还有一些别国数据,因为数据有限,所以本书只能从国外的文献上参考引用。