第二节 研究方法
本章使用1982、1990和2000年的人口普查数据,2005年的小普查数据,2010年CFPS的城市数据,采用模拟世代(synthetic cohort)的方法来分析成长轨迹的结构性变化。笔者在每个样本中截取18—30岁的被访者,将其看作一个模拟世代。模拟世代将截面数据看作追踪数据,认为样本中18—30岁的行为转变的特征是这群人从18—30岁的行为转变经历。这是一种常见的人口学方法。
表3-1是这四个样本的特征。1982年普查数据中18—30岁的被访者大致相当于1950年代出生的青年人。以此类推,1990年普查数据中的被访者大致相当于1960年代出生的青年人,2000年普查数据中的被访者大致相当于1970年代出生的青年人,2010年普查数据中的被访者大致相当于1980年代出生的青年人,而2005年小普查数据中的被访者则是1975—1987年出生的青年人,可用于与2000和2010年的数据相比较。换句话说,比较1982、1990、2000、2005及2010年的这五个数据中18—30岁的人的变化相当于比较50后、60后、70后、80后的成年轨迹的差异。
表3-1 模拟世代及样本量
本章在计算成年轨迹时使用了四种行为转变:在校学习、就业、结婚和生育。因为普查数据只采集了女性的生育信息,因此男性的成年轨迹只拥有前三个行为指标。这四个行为指标都用虚拟变量测量,即当被访者是学生时,在校学习状态为1,否则为0;当被访者有工作时(包括非全职工作),工作状态为1,否则为0;当被访者已结婚时,结婚状态为1,未婚、离异或丧偶时,结婚状态为0;当被访者有至少一个小孩时,生育状态为1,否则为0。这些行为状态并非互斥,因此被访者可以同时占据几个行为状态(如同时在校学习和工作)。需指出的是,2000年和2005年的数据没有收集未婚女性的生育状态。因为中国的未婚生育子女的女性数量非常少(Yeung & Hu, 2013),因此在计算中假定未婚女性的生育状态为0。
在分析成年轨迹变化时,笔者将男性和女性分开进行研究。因中国存在着明确的家庭内部性别分工(男主外,女主内),结婚生育等行为转变对男性和女性的意义不尽相同(Parish & Farrer, 2000)。自改革开放以来,劳动力市场的性别差异不断增大,这使女性在收入和升职方面相较于男性,劣势更加明显(Zhang, Hannum &Wang, 2008; Cao & Hu, 2007)。因此,成年轨迹的变化可能会存在性别差异。