三、五城市调查数据的影响
五城市调查的数据全部用计算机处理,这也是费孝通先生倡导的。东河沿调查之初,费孝通先生访美归来,召集调查组开会,谈了自己访美的观感,特别谈到在美国看到用计算机处理调查数据的感受,他用带着浓重的吴江口音的普通话说道:“只看见数字(在屏幕上)蹉蹉(飞快)地出来,这些数字不就是文章吗?有了它们还愁写不出文章?”他又一次对我们说“不入虎穴,焉得虎子”,叫调查组用计算机来处理东河沿的数据。当时所里既没有计算机,也没有计算机人才。于是他请了自己的弟弟,当时的华中工学院自动化系仿真实验室的副教授费奇来帮忙,费奇又找了自己的助手刘国民。而我这个鸭子也就上架成了计算机“人才”。在费刘两位先生的指导下,我开始了计算机数据处理的前期工作,学习BASIC语言,编制编码手册,编码和过录(将问卷上的编码登录到一张张专门用于数据录入的专用表格上)。五城市调查虽然是后编码的,但是每一个调查变量的分类都是事先已经确定了的,所以编码手册的编制只需给每一个类别定值,确定所有的变量值在过录表,也就是将来在数据文件中的位置和字长(即占用的格数)即可。因为字长需事先规定,所以对于数字型变量,视其占据格数的不同,以8和8的组合作为最大的码值。而将9和9 的组合定义为缺失值。在此期间,我们所迎来了几位第一届南开社会学专业的毕业生,其中一位叫谢文,被分到了家庭研究室,他很快就投入到项目的工作中。他提出在数据录入之后,再进行一次逻辑检验(跨变量地检查数据存在的错误)。于是我们又一起编制了一份逻辑检验的清单,递交给华中工学院费奇,请他们据此编制逻辑检验的程序。一切准备就绪,我和谢文一起,背着问卷和已经过录好的过录表,赶赴武昌华中工学院,在那里的自动化系仿真实验室的机房,通过他们用扩展BASIC语言编制的录入程序和逻辑检验程序,完成了数据录入、逻辑检验和改错工作,获得了撰写调查报告所需的统计数据。东河沿调查是第一个进行计算机数据处理的调查,以后各地都照此办理,在华中工学院完成数据的录入、逻辑检验和改错工作,并产生将来写调查报告需要的统计数据。当时没有像现在这样供数据处理的软件包,如SPSS、SAS和STATA等。数据处理的程序都是用费奇和刘国明先生,用扩展BASIC编写的程序进行的。
确切地讲,数据录入是分城市分卡进行的。即每一个调查点的数据,分成三卡(三套过录表)按卡一条一条(一行一行)记录输入计算机,生成与三个卡(有关卡的问题可参阅《五城市联合调查组》的问卷)对应的数据文件,存储在一张8吋软盘上。所以五城市调查的原始数据的物理形式是8张8吋软盘,每一个软盘都有三个对应于三个卡的数据文件。数据文件使用的计算机码是CROMCO Z80系列,而非IBM系列的ASCII码。1983年我用所里的科研经费结余,购置了一台由北京计算机研究所和计算机五厂生产的BCMⅢ。从此社会学所和项目组有了自己的计算机。这台计算机也是CROMCO Z80系列的,使用的也是两个8吋软驱。年底,项目组在北京举行《中国城市家庭——五城市家庭调查报告和资料汇编》(山东人民出版社,1984年,济南)一书的编辑和定稿会议时,我们就是用那台机器对五城市调查的数据进行分析,为报告提供所需的各种统计数字和表格。为了实现这一目的,我们首先对东河沿和尖山街的数据,按照后来联合调查组的数据格式,重新进行了编辑和调整,以使数据格式与联合调查组其他调查点一致,产生了格式统一的五城市8个调查点的数据。
1983年6月,广州社会科学研究所的于幼军主动提出用五城市调查的问卷在广州进行一次调查,调查结束后,何颂扬先生携问卷和过录表来京,我们也是用这台计算机处理了广州的数据。这样五城市8个调查点的数据,就扩充成了六城市九个调查点的数据。由于这项工作完成在《中国城市家庭——五城市家庭调查报告和资料汇编》定稿之后,所以该调查的数据和报告并未收入该书。
1985年出版的《中国城市家庭——五城市家庭调查报告和资料汇编》(五城市项目组,山东人民出版社,济南,1985年)一书是项目组的共同成果。责任编辑房喜兰女士是一位资深编辑,独具慧眼看中了这一选题,承担起该书编辑、出版和发行的全部工作。该书出版对国内外的社会学界产生了很大影响,对家庭社会学研究和抽样调查起到了很好的推动作用。1986年我去荷兰求学,学位论文就是使用这本书刊登的资料。我记得我第一次去莱顿大学汉学院去见学校为我推荐的指导教师彭轲(Frank Pieke)的时候,他从办公桌的抽屉里拿出了一本书,对我说,你是研究中国家庭的,一定要看这本书,这本书就是《中国城市家庭——五城市家庭调查报告和资料汇编》。当时我也很惊奇,没有想到山东人民出版社也将这本书发行到了国外。而实际上我的学位论文使用的最重要的数据都来自这本书。根据分析得到的被调查人分年龄组的家庭结构分布,我论证了中国人一生生活的家庭结构是随年龄变化而变化的,与西方不同,中国的核心家庭,并非婚姻的产物,而是从夫方父系家庭这棵大树生长过程中生长出来的。主干家庭,而非联合家庭,也非核心家庭才是中国传统家庭的基本结构。在各种家庭结构类型构成中,由于传统的中国大多数家庭都是多子女家庭,因此核心家庭所占比例始终都是最高的,并不存在现代化理论所谓的核心化趋势。我的学位论文得到他的高度赞扬,为此他专门给校方致函,对论文做了很好的评价。我在ISS的指导教师,将论文寄给了荷兰家庭研究会会长和跨大学人口研究所(NIDI)所长库耶(Kooye)教授。他也对论文做了较高的评价,认为我的观点很有新意。他建议在此基础上做进一步的研究。因为分组数据,毕竟还是截面数据,如果能用纵向的数据来证明这一结论,便会有更大的说服力。正是根据他的建议,我在以后自己主持的调查中,如七城市家庭调查和国情调查的问卷中都设计包含了一张家庭生命过程表,用来收集被调查人从出生到调查进行时生活的家庭结构类型信息。为了给我今后的研究提供更多的帮助,他邀请我去他乡下的家中详细讨论一下这个问题,他说他家里有一个有关家庭研究书籍和刊物的小型图书馆,可为这个研究提供很多资料。由于在电话中没有听清约会的时间,结果还害得老先生和他的夫人在乡下的火车站白等了好几个小时。那时我已经在准备回国的各项事宜,在离开荷兰之前再也没有机会访问库耶先生的家。后来我的同事折晓叶去荷兰访问,专门去荷兰的乡下他家中,代我探望库耶先生。在完成ISS的学业后,我应邀到NIDI做为期三个月的访问,利用这三个月的时间,我对这本书汇编部分的统计资料进行了二次分析,完成了一篇中国家庭研究的综述性报告。NIDI的同事对这个研究表现出极大的兴趣,希望今后能一起用原始数据对中国的婚姻家庭做进一步的研究。我现在还记得我的同事巴特雷马当时问我的问题:“Where is the raw data?”我现在做的工作就在回答他34年前提出的问题。杨,我希望现在我做的工作,能实现你三十年前想分析的那套资料愿望。如果有机会,我希望能有机会像当年在NIDI那样,我们坐在计算机前一起来分析它。
1990年,我受社会学研究所委托,组织了联合国教科文组织委托的“亚太地区家庭未来讨论会”。这个会对于我来讲,有两大收获。首先,我在会上以《中国城市家庭——五城市家庭调查报告和资料汇编》和人口普查数据为依据,探讨人口要素对家庭结构的影响。我先用五城市分年龄组的家庭结构类型的分布,论证了传统中国家庭结构主干家庭为干、核心家庭为枝的结构形态。而支撑这种形态的人口要素是出生与死亡达到某种相对的平衡,即替代水平不低于2.1。但是人口普查的数据表明,一胎化后中国人口替代水平已经低于2.1,而且呈进一步下降的趋势。这意味着支持主干家庭为干、核心家庭为枝这种结构形态的人口要素已经不复存在,因而家庭结构形态必将随之发生变化,而这一变化,必将对我国社会其他方面产生巨大影响。当时我的报告的评论员是当时日本家庭社会学会的会长森冈清美(森冈先生是我的同事张萍推荐的)。森冈先生不仅对我提出的观点很感兴趣,而且也对我使用的数据源自的调查——五城市调查感兴趣。会后森冈先生对我说,以前对中国的家庭研究不太了解,现在才知道,原来中国在这方面已经做过这样大规模的家庭调查。他说这是中日双方今后开展合作研究的基础。他表示,回去以后很快就会组织一个老中青三代的研究团队,开展中日家庭的比较研究。森冈先生果然兑现了自己的承诺,次年就率领一个由老中青三代组成的日本家庭社会学家组成的代表团,在北京和杭州两地举行了中日家庭比较研讨会。在杭州,森冈先生的学生,后来的日本家庭社会学会会长,东京都立大学教授石原邦雄来到我的房间,由社会科学院日本研究所的王伟先生做翻译,讨论了开展合作研究的问题,达成了开展中日家庭的比较研究的口头协议,由双方共同讨论决定调查问卷和入户访谈提纲,调查和研究经费由日方申请,中方负责选择调查地、抽样和数据处理,共享调查数据。自此,我和日方团队的合作研究延续了20年。在此期间进行了两次抽样调查、一次深入访谈和多次互访和讨论会。后来在石原先生的推动下,又吸收了韩国家庭研究者,将中日比较研究,发展成中日韩的东亚家庭比较研究。今天活跃在社会学研究和教育第一线的老师,清华大学的王天夫、南京大学的吴愈晓、中央财经大学的范欢欢和中央民族大学的王纪芒等人的学位论文数据都来自这些调查。社会学所的同事陈婴婴和日本研究所的王伟都对这项持续20年的合作研究做出了很大贡献。
另外,我与所长陆学艺达成一个口头协议,一方面,我一定按联合国方面的要求,完成讨论会的全部工作,另一方面,我也希望会议结束后,所里不要将结余的经费挪作他用,而要用它来购置一台计算机。在我按所里的要求完成了讨论会的所有工作后,陆学艺所长也兑现了自己的承诺。于是我用剩余的会议经费2000美金,购置了所里第一台IBM系统的PC。这是一台美国华裔生产的sun286,有了这台机器,我才有可能开展以后的中国百县市调查和七城市家庭调查。那时五城市调查已经结束多年,并不需要用它处理五城市的调查数据。但是它使我萌发了将五城市调查原来保存的CROMCO Z80系列的ASCII码数据转换成IBM系列的ASCII码数据的想法,而且立即诉诸行动。我请人用这台机器模拟打印机,将从BCMⅢ上读出的CROMCO系列的数据,存入这台机器,完成了将五城市调查数据从CROMCO 系统到IBM系统的转换。现在想起来,这次转换是很及时的,因为不久之后机器的更新换代越来越快,这两台机器很快就不敷使用,为功能更为强大的新微机取代而被弃之不用。这就是说,如果当时未能及时将这些CROMCO系列的文件转成IBM系列的文件,那么今天重新整理这批数据就会大费周章了,真是万幸。
正是在那一年,原来五城市项目的刘金云先生从密歇根大学回国探亲,给我带来了一套DOS版的SYSTAT,这是我使用的第一套数据分析软件。之前我曾经试着在SUN上安装DOS版的SPSS,但是由于SUN的系统与IBM并不完全兼容,DOS版的SPSS无法在SUN系统中正常运行。而SYSTAT则可以在SUN系统正常运行。我立即用它生成了一套SYSTAT格式五城市调查数据,并与项目组原来的成员李东山合作编辑了一本《中国城市家庭——五城市家庭调查双变量和三变量资料汇编》(社会科学文献出版社,1991年5月,北京)。该书是对1984年出版的那本中国城市家庭资料汇编部分的补充,书中收录的都是双变量和三变量的交互表。