上QQ阅读APP看书,第一时间看更新
第三节 描述性研究常用的统计分析方法
描述性流行病学常常解决关于疾病发生的以下问题:有多少人发病、什么时间、什么地方发病、危及的人群主要有哪些?对于第一个问题通常采用频数或率,对后三个问题则用时间、空间和人群进行描述,通过比较,初步分析存在分布差异的原因,提出相关假设,并提出进一步研究的方向和制订初步防制对策。
描述性研究通过描述疾病或事件的三间分布(人群分布、时间分布和空间分布)达到:用通俗易懂的术语描述有关公共卫生事件的详细特征;明确公共卫生事件危害的人群,并提出病因、疾病传播方式假设,最终达到疾病预防与控制的目的。
一、人群分布
按人群特征进行流行病学分析的目的,在于全面描述病例特征,并发现病例与普通人群的不同。这有助于提出与危险因素有关的宿主特征,其他潜在危险因素以及传染源、传播方式和传播速度的假设。通过分析患者的特征,会发现一个或一些特别的特征,通常会对查找危险人群提供一个线索,甚至找出一个特异的暴露因素。有些疾病首先侵犯一定的年龄组或种族,有时患某种疾病的人与职业明显相关。想收集所有与人群有关的潜在危险因素和暴露因素是不可能的,但对疾病宿主、传播途径、高危人群认识越多,将会获得更特异和准确的信息,以决定如何防治疾病。
个体信息可以用列表或图解的形式直观地进行描述。当个体特征属于正常或连续的范围时,如年龄或体质指数,用图解的方式来表示可以使描述更清晰;对可以用率表示的定性资料,如性别、民族、职业等最好选用列表的形式。对人群分布资料的评估要掌握两点:一是确定人口资料的率比时间和空间的率更关键,二是年龄与许多疾病发病和死亡有关,它是最重要的独立决定因素之一,因此要首先考虑。
群体特征是由个体特征构成的,这些群体可以特指一个家庭或居住在一定地理范围内的人群,也可以是具有相同兴趣、爱好或相同的风俗习惯的群体。按以上的人群特征对疾病进行描述,可以揭示疾病模式,有助于提出相应的研究假设。通常可以从对报告病例探究式的访问中可以获得这些与个人特征有关的资料。任何疾病流行都有其分布特点,有的呈很强的聚集性,有的呈随机分布,有的在家庭或家族内表现出一致性。如果分布呈聚集性则暗示家庭成员有共同暴露史,病原从一个家庭成员传给另一个,可能是居民区内有环境暴露,房屋位于或靠近高危险区,在媒介生物数量变化不大的情况下,形成“人-昆虫媒介-人”的传播。如呈现家族随机性分布或对称分布则暗示暴露发生在家庭单位以外,或者说危险/保护因素在所有单位(如城市供水管网)内均匀分布。可通过人口普查数据得到家庭大小和家庭成员数等资料作分母计算率进行比较;也可以通过抽取大量的小群体(如家庭)样本进行危险因素评估,但这样可使计算出来的率非常不稳定。目前,有多种统计软件可以用来对家庭样本或类似的较小人群样本进行聚集性分析。
在现场流行病学分析中,所有的流行病学工作者都根据年龄来确定疾病流行情况。从简单到发现某卫生事件仅感染有限的年龄段到复杂到比较各组人群特定年龄段的发病率。年龄代表了3种不同类型风险的决定因素。
1.宿主条件及对疾病的敏感性
不同年龄的人群对疾病的抵抗力、感染疾病的敏感性不同,如年龄是慢性病、许多传染病最重要的影响因素之一。
2.暴露强度
如婴幼儿暴露于由粪口途径传播疾病的风险远远大于成年人。
3.时间强度
年龄越大的人,暴露时间就越长。特别是对那些潜伏期较长的疾病如肺结核,通常反映了在过去几十年里都一直处于暴露状态。
因不同人群的年龄构成可能存在差异,所以在计算年龄组的发病率时对年龄进行调整或标准化尤为重要。经过年龄调整后得出的率可以在不同地区、同一地区不同时期、不同种族或社会经济水平的人群之间进行比较。调整率排除了年龄的干扰,但也会掩盖各年龄组发病率的潜在可能模式。因此,在对年龄进行标准化之前,最好用图或表检查一下各年龄组的率值。
在现场流行病学中,还需描述性别、种族、民族、教育程度和社会经济水平等其他个体特征的发病率、患病率等指标。
二、时间分布
根据疾病、健康、伤害或公共卫生事件的性质,设置以年、季、月、周、日或时等时间单位,描述病例或事件发生频率及变化趋势。描述时间分布一般可分为短期波动(暴发)、季节分布、周期分布和长期趋势等层次。
在对流行病学资料进行分析时,必须始终考虑时间要素。暴发或流行的估计要求将特定时间的病例数与同期的预期病例数比较。因此考虑时间的时候,需要明确提出有关的时段或时期,弄清暴露和卫生事件之间的时间关系,做好时间资料的来源及资料的处理。描述时间分布最好使用率,但如果卫生事件持续时间短、人群稳定,此时也可以只用绝对数进行描述。
卫生事件可能在时间分布上表现出一些重要特征,特别是暴露于危险因素下的时间和卫生事件发生的时间。其他相关事件也应按时间先后顺序进行描述,从而为调查提供准确的时间框架。
信息的准确度可因各种情况或疾病类型不同而有所差异,近期发生的急性事件,其信息准确度可能比慢性事件高。在某些情况下,还要仔细区别促发事件与结局事件发生的时间(如损伤和死亡)。
一个事件可能在时间上与另一个事件相关联,因此如果知道该事件发生的时间和已知或假设的暴露时间,就可以估算潜伏期。当病因不明时,估算暴露和症状发生之间的时间间隔对于病因假设是至关重要的。当病因可疑时,做类似的比较有助于排除或验证假设。同样如果知道潜伏期,就可以估计暴露时间间隔,从而确定在该时间段内潜在的暴露因子。
一旦确定某特殊事件或异常情况与所研究问题在时间上有关联,就可以建立相关假设。
用图表方法分析时间数据,可以更直观地描述其相对影响、过去及现在的态势、未来潜在的发展趋势,以及相关事件的影响程度。根据所研究卫生事件的不同,其时间段可以是年、月、周、日甚至是小时。对于慢性疾病或其他情况,通常用长期趋势来描述,即将几年甚至几十年内每年的发病率在图中绘制出来,对于急性疾病,时间轴最好是发病时间。但在监测系统中,一般只能获得报告时间而非发病时间。
流行曲线可用于描述暴发可能的传播途径、流行的大致时间、暴发的模式等,比简单的病例线图要清楚得多。通常从一个简单的疾病发病时间图表中可得到大量的信息,如果疾病的潜伏期是已知的,就能相对准确地区别同源暴露、人与人之间传播或是两者混合传播。相反,如果知道暴露是何时发生的,就能确定潜伏期的长短。另外,如果流行在继续,对疾病又非常了解的话,还可以预测可能发生多少病例。图4-8提示:该疾病流行是一个多次同源暴露、潜伏期短(短时间内发生多起病例)、暴露因子持续数周的疾病。后经调查确定该病为军团病。发病率绘制成线图或频数多边图。
图4-8 1968年6—8月美国密西根市军团病发病情况
三、空间分布
描述流行病学的另一要素是空间分布,空间分布是指疾病、健康、伤害或公共卫生事件在不同行政区划、不同地形、不同住处等不同地区之间发生的差异。
在暴发或流行现场调查中,地区分布信息应包括居住地、工作场所、学校、娱乐场所、旅游地点或其他有关资料,同时还需要收集一些更深入描述在这些地区活动的特殊资料,例如在建筑物内部或办公室活动的详细情况,并需了解有关人员在这些地方停留的时间。地区分布信息可能准确到经纬度或医院床位号,也可能简单到省(市)。因为人口估计或人口普查均局限于标准的地理区域(如国家、省、市、县或某特定区域),所以率的计算也局限于这些区域。
暴发调查一定要区分始发地点、暴露地点和就诊地点,它们在流行病学上有不同的含义。
有时疾病发生在社区中一个独特的地方,如果能观察到这点,对病原体和暴露特征则可获得大量的线索和证据。供水系统、牛奶供应、垃圾处理排风口、风向、建筑物间的气流以及传播媒介的生态习惯在传播微生物或病原体和确定疾病的危险人群中扮演着重要角色。
如果把病例或事件按地理特征绘制成统计地图、标点地图、区域地图和率等图示格式,则可以更直观地描述疾病的地区分布,并有可能说明其潜在暴露因素的来源和途径,还可以帮助鉴定传播媒介或途径。
1.统计地图
统计地图是组织、描述和核实地区资料的最佳方法,能够比较各种疾病在不同地区的发病率。相对于表格而言,统计地图容易识别并易于比较。如在表格里,不同地区两个率的差异可能很小而不易觉察,但在地图上,发病率较高的地区其空间分布和聚集情况可能会显现出来。
2.标点地图
在暴发调查中,将病例标点在原始地图、平面地图或其他空间准确定位的图片上,绘成标点地图。如果配合掌上地理定位装置或地球卫星定位系统,病例就可以在地球表面的图片上精确地标识出来。用绝对数直接标识在图上有一个很大的缺点,即只能在人口密度相对均衡(如同一个城镇内)时使用。对病例分布进行描述前,应仔细检查原始地图。如果每单位内有充足的病例并且知道分母时,也可以将率或比标识在地图上。如图4-9示1854年霍乱在伦敦流行期间,英国医生John Snow针对伦敦霍乱的流行,创造性地使用病例分布的标点地图法,将伦敦布劳德大街(Broad Street)水井周围地区的霍乱病例,在地图上逐一标明位置,由此确认了霍乱的传播与饮水即水源污染的关系。
图4-9 1854年伦敦霍乱病例分布标点地图(每个点代表一个霍乱病例)
3.等值区域图
首先将地图划分成不同的人口区,计算各区的率或比,然后按各自的率或比进行排序并划分等级,不同等级涂上不同深度的阴影。如图4-10,2008年安徽阜阳市手足口病报告病例发病率区(县)分布。等值区域图绘制容易,并且能够很好地显示率或比在空间上的分布,所以是描述流行病学一个十分重要的工具。
图4-10 2008年1—5月安徽阜阳市手足口病报告病例发病率区(县)分布图
四、人群、时间和空间的综合分析
在描述流行病学研究中,经常需要将人群、时间和空间这三个主要的流行病学变量中的任两个方面甚至全部结合起来进行比较,最直观的方法就是绘制一系列小型多样统计图。如果描述某地区不同时段某疾病的进展情况,最好绘制系列小图。要比较不同地区、不同人群流行曲线的形状,最有效的方法是使用一系列小型流行曲线。要揭示某事件在时间和空间上的变化,可以使用一系列小的线性图来进行比较。如图4-11为空间分布结合时间分布的综合图,资料来自WHO网站。
图4-11 2012—2015年全球中东呼吸综合征(MERS)病例地理分布图
根据以上描述性统计分析,现场流行病学调查人员就可以结合医学知识、生物学知识、环境等方面的知识,计算不同的频率指标(见第二章),并进行分类比较,采用Mill法则提出病因假设(其方法见第八章),并制订初步防制对策。
(李锡太)