医学科学研究与设计
上QQ阅读APP看书,第一时间看更新

第一节 实验性研究设计的基本要素与基本原则

一、基本要素
实验性研究中的三个基本要素,包括处理因素、受试对象和实验效应指标。实验设计的中心内容就是科学选择和合理安排实验三要素,它是关系到研究工作能否达到预期结果的重要保证(图3-1)。
图3-1 实验性研究设计的基本要素

(一) 处理因素

处理因素(treatment factor)是指研究者根据研究目的欲施加于受试对象,在实验中作用于受试对象引起直接或间接效应的因素。处理因素一般是研究者主动施加的某种外部干预,可以是生物、理化、心理、社会等因素,也可以是机体本身内在对机体有影响的因素。根据设置处理因素的多少,可分为单因素实验和多因素实验。与处理因素同时存在,能使受试对象产生效应的其他因素称非处理因素,当非处理因素夸大或缩小处理因素与实验效应之间的真实联系时,引起混杂,此时的非处理因素称为混杂因素(confounding factor)。例如,在比较饲料对动物体重增加作用的动物实验中,动物种属、窝别、年龄、性别、体重、营养状况等也可能影响体重的增加量,它们属于实验中的非处理因素。实验研究时需尽量控制非处理因素的影响,以减少误差。如果某种非处理因素对效应影响很大,也可以考虑作为处理因素加以观察。

1.处理因素的确定

实验性研究首先要根据研究目的和研究内容确定哪些是处理因素,哪些为非处理因素。有些实验需要研究的因素很多,由于各方面条件限制不可能把所有的因素都放在一次实验中进行研究,这就需要研究者在众多的因素中,进行筛选、剔除、寻找出主要的处理因素来进行实验。

2.处理因素水平的选定和组合

因素在实验中所处的状态称为因素的水平(level),亦称处理。为提高实验研究效率,对研究的因素可设置不同的水平进行研究。根据研究因素和水平的不同可进行不同因素和水平的组合,有单因素单水平、单因素多水平、多因素单水平、多因素多水平的实验研究。处理因素的数目和水平数的选定都要适宜。一次实验涉及的处理因素不宜太多,设置的水平数也不要太多,否则头绪过多,实验和分析繁杂。

3.处理因素的标准化及交互作用

处理因素的标准化是指处理因素在整个实验研究中始终如一,保持不变。如处理因素是某药品,其名称、性质、成分、作用、使用方法应自始至终相同,包括药品生产厂家、出厂日期、批号、保存方法都应该一致,这样才能保证实验结果的准确性、可靠性和可比性。在进行多因素实验研究时还需了解所研究的因素间是否存在相互影响即交互作用(interaction),如存在交互作用则应按分析交互作用的方法设计分组。

(二) 受试对象

受试对象亦称实验单位(experimental unit)或实验对象,为处理因素作用的客体,是接受处理因素的基本单位。根据受试对象的不同,实验性研究分为动物实验研究、临床试验研究和现场试验研究三类。依研究目不同,有体内实验(in vivo)、体外实验(in vitro)和半体内实验(ex vivo)三种不同研究方式,受试对象可以选择人、动物、植物、离体器官、组织、细胞、亚细胞、血清或其他生物材料。

1.受试对象的选择

受试对象的选择至关重要,它直接影响实验结果的准确度。在实验前必须严格规定选择受试对象的条件,即明确纳入标准(inclusion criteria)与排除标准(exclusion criteria),以保证受试对象的同质性和代表性。所选择的受试对象必须满足两个基本条件:①对处理因素敏感;②反应稳定。例如,临床上研究某药物对高血压的疗效,宜选用Ⅱ期高血压患者为试验对象。因Ⅲ期高血压患者对药物不够敏感,而Ⅰ期高血压患者血压往往不稳定,波动范围较大。
如果以动物为受试对象要注意受试对象的相似性、可行性。相似性指在生理、生化、代谢、遗传背景等方面与人的近似,如啮齿类的哺乳动物,用猴、猩猩更好,但还要考虑其是否经济、易得,即可行性。所以动物实验应注意动物种类、品系、年龄、性别、体重、窝别和营养状况等。
如果受试对象是患者,所选择的受试对象应具有代表性、可比性、依从性和安全性。受试对象所患疾病应该是诊断准确、正确分期、表现典型,同时还应注意性别、年龄、病情和病程等基本一致,以保证其代表性和可比性。依从性是指受试对象按预定计划接受处理因素的合作程度。安全性即在研究过程中,不会耽误患者治疗、不会对患者造成新的损害,因此不能配合的患者或危重患者、孕妇,一般不能作为受试对象。
根据研究目的,在受试对象入选条件中应对一些非处理因素加以考虑和控制,如:受试对象的年龄、性别、民族、职业、文化程度、经济状况、居住条件、生活习惯、个人嗜好、用药史等对处理的效应会产生影响,在设置实验组和对照组时要均衡这些因素。以离体器官、活体组织、分泌物、体液等作为受试对象时,应考虑取材条件、部位、新鲜程度和保存、培养等因素的均衡一致性。来源于人或动物的细胞是医学实验研究常用的受试对象,细胞有原代细胞和传代细胞之分,不同的细胞株特性各不相同,应根据研究目的加以选择,并严格控制培养温度、湿度、CO 2浓度、培养基的配方和pH值等因素的影响。无论受试对象是人、动物或其他生物材料,都应注意受试对象对处理因素反应敏感、特异、稳定,如进行环境中某致癌物引起肺癌的动物实验研究,最好选择A系小白鼠,其次是 Balb/c小白鼠,A系和 Balb/c小白鼠对致肺癌的致癌物敏感、特异,且肺癌自发率低。

2.受试对象数量的确定

受试对象的数量即样本含量(sample size)的估计参见第六章。

(三) 实验效应

实验效应(experimental effect)是处理因素作用于受试对象后引起的反应,可通过具体的指标来表达,是结果的体现,是实验研究的核心内容。效应指标的选择也是关系实验成败的重要因素。在选择效应指标时要注意指标的关联性、客观性、精确性、特异性和敏感性。

1.指标的关联性

选择的指标与处理因素之间具有本质的联系,能够确切地反映处理因素产生的效应,即指标的关联性。所选的指标是否关联、是直接关联还是间接关联、关联的程度如何、是否因果联系,均依赖于研究者的专业知识。如:要研究外源化学物是否具有脂质过氧化作用,可通过测定脂质过氧化中产生的衍生物丙二醛含量来判断是否产生脂质过氧化和过氧化的程度。

2.指标的客观性

医学科研的效应指标分为客观指标(硬指标)和主观指标(软指标)。客观指标值是借助一定的仪器或检验等方式测定所得的客观、定量的数据,而主观指标值则是通过研究者观察判断或由受试者自身主观感觉而回答的主观、定性的结果。由于主观指标值受研究者或受试者主观因素影响较大,所得结果容易产生偏差,所以在选择效应指标时要尽可能地选择客观、定量的指标,避免选用主观、定性的指标。临床上有些指标看似客观指标而实际上是主观指标,如:X线胸片,病变在胸片上的阴影是客观存在的,但需要通过医师来判断,为避免偏差影响结论,应将主观指标客观化。如对患者的询问应避免暗示,对一些需要主观判断结论的观察可采取多人、多次、盲法、交叉法进行观察判断。对一些定性的指标要尽可能将其转化为定量指标。

3.指标的精确性

指标的精确性包括指标的精密度与准确度。精密度是指重复测量或观察时,测定值(观察值)与其均值的一致程度,多次测定结果重复性好说明精密度高,精密度的大小受随机误差影响,不同的指标精密度要求不同。准确度是测量值的正确性的量度,即测定值(观察值)与真实值的接近程度,它受系统误差影响。因为系统误差的存在并不影响测定的精密度,所以不能认为精密度高,准确度也高。科学研究首先要求准确度高,其次要求精密度好。准确度和精密度都高其精确性才好。指标的精确性与指标检测的方法、仪器、试剂、实验条件有关,还与研究者的技术水平及操作等因素有关。所以要提高指标的精确性,除了要有良好的实验条件、校准仪器、标定试剂以减少系统误差外,还应该重视选用高精度和高稳定性的仪器、熟练技术等以减少随机误差。

4.指标的特异性和敏感性

特异性是表示该指标能够鉴别受试对象真阴性的能力,指标特异性高,不易受非处理因素的干扰,使受试对象出现假阳性的可能性减小。敏感性则是表示该指标能够检出受试对象真阳性的能力,敏感性高的指标对处理因素反应灵敏,能更好地显示出处理因素的效应,使受试对象出现假阴性的可能性减小。科学研究要根据研究目的选择特异性高或敏感性高的指标,如果能选择特异性和敏感性皆优的指标更好。
为了提高效应指标的可用性、精确性,必要时可同时选用多种方法和多个指标,通过多方法、多途径全面观察,来相互补充、互相验证和综合分析,就可以从不同的角度准确地了解事物的全貌。当然并不是指标越多越好,究竟选择哪些指标、设定多少指标适宜,取决于研究课题本身的需要。
二、实验性研究设计的基本原则
实验设计要求做到科学、严谨、合理、高效。其目的在于减少误差、提高效率、获得准确可靠的实验结果。从统计学角度考虑要求遵循对照、随机、重复三大原则,以达到最大限度地减少误差的目的,以较少的人力、物力和财力,获得最真实、最可靠的结果。

(一) 对照原则

对照(control)就是在实验中设置与处理组相互比较的对照组。没有比较就没有鉴别,人们认识事物都是通过比较事物之间的差异而显示出其本质的差别。医学科研的对照就是一种比较的方法,比较的基准就是对照,通过与对照的比较,增加实验结果的可信度和说服力。

1.设置对照组的意义

医学实验研究多数是以生物体为受试对象,影响实验结果的因素多而复杂,不仅自然环境、实验条件可以影响,生物的变异性也会影响;临床上有些疾病不经过治疗而能自愈,不设对照则难以区分是处理因素的作用还是自愈所致。还有许多非处理因素如气候、营养状况、社会因素、心理因素等都会使实验结果产生偏差。要排除上述因素对实验结果产生的偏差,就要设立对照组,以甑别处理因素与非处理因素的效应,排除非处理因素干扰;通过对照可减少或消除实验误差,更好地评价和鉴别实验结果的科学性、真实性,避免偏倚而产生错误结论。
对照组的设立必须遵循均衡、同步和专设三个基本要求。均衡是指在设立对照组时,除施加于实验组的处理因素外,其他对实验效应有影响的非处理因素在对照组和实验组都要一致。只有满足均衡的原则才能显示“对照”的作用。所设对照是否满足均衡,可通过方差分析、 χ 2检验等方法分析。不同时间和空间的实验因条件不同,其结果缺乏可比性,只有在整个研究进程中处于同一空间和同一时间,才具可比性即遵守同步原则。专设是指任何一个对照组都是为相应的实验组专门设立,一般不得借用文献上记载、历史的结果或他人研究结果作为某研究的对照。

2.对照的形式

对照的形式常有空白对照、实验对照、安慰剂对照、标准对照、阴性与阳性对照、相互对照。

(1) 空白对照:

空白对照(blank control)是指不施加处理因素或干预的对照组。例如,研究乙型肝炎疫苗预防乙型病毒性肝炎效果时,实验组人群接种乙型肝炎疫苗,而符合均衡原则的对照组人群不注射乙型肝炎疫苗,观察一定时期后比较两组人群乙型肝炎的发病率;研究雌激素或口服避孕药是否有致癌作用时,以符合均衡条件人群的癌症自然发病率为对照,以实验组与对照组的癌症发病率差值来反映药物的致癌作用。如果不设空白对照组,有可能把实验组人群中自然发生的癌症误认为药物引起。临床试验的空白对照可排除或控制生物体自然发展的基数和疾病自愈、缓解、恢复等对结果的影响。

(2) 实验对照:

根据实验研究方法不同有时需使用实验对照(experimental control)。如应用N-甲基-N -硝基-亚硝基胍(MNNG)诱导大鼠胃癌的实验研究,采用灌胃方法给实验组大鼠施加处理因素MNNG,灌胃的过程中或多或少会对动物上消化道造成损伤,为排除灌胃损伤对结果的影响,对照组也要求灌胃同等量的生理盐水或药物溶媒。这种采用与实验组操作条件一致的干预措施,称为实验对照。
凡是对实验结果有影响的操作、溶媒等都应该设立实验对照。在进行动物实验时,估计对实验结果有影响的操作均应考虑设立操作对照,因为不论灌胃、注射、手术、穿刺,操作本身会造成受试动物损伤,即使操作十分熟练也难以避免操作带来的误差。给对照组施加与实验组条件一致的操作称为实验操作对照,操作对照在于控制实验操作产生的影响。以实验组所用性状相同的溶媒作对照,可防止误将溶媒的效应当作药物的作用,得出偏性结果。实验中所用的药物溶媒有些是具有药理作用,如:静脉注射吐温能降压、溶血、升高血清胆固醇;二甲亚砜有止痛、抗炎、退热、扩血管等作用。受试药物难溶成分常用吐温或二甲亚砜助溶或溶解,此时应该用等量、相同浓度的溶媒作对照,以排除溶媒作用对实验结果的影响。

(3) 安慰剂对照:

安慰剂对照(placebo control)是指给对照组受试者使用无药理活性的安慰剂。人不仅有生理活动还有心理活动,其精神心理因素对疾病的发生、发展、治疗和康复具有重要影响,如临床上有些疾病通过心理调理或暗示疗法使病情得到缓解或治愈,因此临床试验研究中有时需设立安慰剂对照。安慰剂对照目的主要是消除受试者精神心理因素影响所产生的偏倚,分离出所研究药物产生的真正效应或不良反应,更为准确地判断药物的疗效。
在受精神心理因素影响较大的慢性疾病的研究中,可考虑采用安慰剂对照;新药和老药新用治疗慢性病的临床试验也可设立安慰剂对照;轻度精神忧郁、癔病可以使用安慰剂作为心理治疗的一部分。诊断已明确不需要药物治疗的患者可作为安慰剂对照,但是对危重患者、病情发展迅速者不得使用安慰剂,即不得设立安慰剂对照。
实验所使用的安慰剂应该在剂型、包装、颜色、大小、形状、气味等外观上完全与试验组受试药物相同,否则会导致安慰剂的失效和试验的失败。安慰剂对照与双盲法同时实施效果更好。应当强调随着医学科学的发展,安慰剂治疗只有在尚无肯定有效药物治疗的情况下,方可使用安慰剂对照,否则应使用标准对照。

(4) 标准对照:

标准对照(standard control)是指用现有的标准值或正常值作对照,临床上用公认的经典治疗方法或标准治疗方法作对照也属标准对照。应用标准值或正常值作对照时,试验组受试对象应该与标准值或正常值来源的研究对象属于同一总体才具有可比性。
在评价某种药物或新疗法对病情较重疾病的疗效时,为不延误患者的治疗,不能用安慰剂对照,可用标准对照。即用公认的标准疗法(或常规疗法)作对照。例如研究人参皂苷的抗心肌缺血作用,可用已知的有效药物普萘洛尔(心得安)或长效硝酸酯类作对照。在应用标准治疗对照时,要注意选择疗效被公认或肯定的药物或疗法,而且与所试验的药物或疗法是属于同一类型。同时也必须在不耽误患者的治疗、不导致病情恶化的前提下进行。

(5) 阴性对照与阳性对照:

在一些医学实验研究中通常要设置阴性与阳性对照(negative and positive control)。如毒理学的致畸、致突变和致癌实验要设立阴性和阳性对照组。研究某化合物是否为致癌物的长期动物实验研究中,阴性对照组动物不使用受试物染毒,只作实验操作对照;阳性对照组用已知的致癌物染毒。如果阴性对照组出现了发生癌症的个体,说明是动物的自发性癌症,结果分析时则应减去;如果实验组受试者不发生癌症而阳性对照组的个体发生了癌症,可以认为该毒物对这种动物无致癌作用;倘若阳性对照组与实验组均未癌症发生,则有三种可能,①该受试物是致癌物,但所选动物对这类毒物不敏感;②该受试物本身不是致癌物;③该毒物为致癌物,但因染毒的途径、方法、剂量等设计不合理而未诱导出癌症,这需要进一步深入研究探讨属哪种情况。只有当阴性对照组未发生癌症或仅发生极少量癌症(自发),实验组和阳性对照组都诱导出有意义的癌症,结果通过统计学分析,对判断受试物的动物致癌性才有参考意义。

(6) 相互对照:

相互对照(mutual control)指实验中不另设对照组,以几个有效处理的实验组互为对照。例如要研究几种药物治疗高血压的疗效,已知几种药物均有效,目的是要比较几种药物疗效的高低、产生疗效的时间、疗效的稳定性等,此时不必另设对照组,可将各种药物的疗效互为对照,相互之间进行比较分析。同一批样品,采用几种不同的方法或仪器测定,比较各种方法的精密度、准确度也可以采用相互对照。

(二) 随机原则

随机(randomization)是指在实验分组时,每一个受试对象都有同等的机会被分配到任何一个组中去,不受研究者主观因素的影响。随机原则是医学科研设计的重要原则之一。

1.随机化目的与内容

随机化是保证各组间非处理因素均衡一致的另一重要手段,它使不可控制的因素在实验组和对照组的分布较为均匀。随机的目的有三点:①保证实验组和对照组受试对象各种已知或未知的基本特征(如年龄、性别、病情、病程等)均衡,具可比性;②避免人的主观因素影响,让机遇起作用,减少误差,使样本对总体有代表性;③随机化是统计方法的基石,是对样本资料进行统计推断分析的前提。
随机化的内容包括随机分组、随机抽样和随机实验顺序。①随机抽样:在抽样研究中每一个符合条件的受试对象参加实验的机会均等,即总体中每个个体都有均等的机会被抽到样本中来;②随机分组:每个受试对象分到不同实验组或对照组的机会相同,以保证各组之间受试对象尽可能均衡一致,使各组间的结果具可比性;③随机实验顺序:每个受试对象接受处理的先后机会相同,以消除不平衡的实验顺序所产生的偏差。

2.随机化方法

随机化的方法有抓阄、摸球、掷币、抽签等,应用最广泛的是随机数字表法、随机排列表法等。

(1) 抽签法:

又称半随机法、简单随机法。抓阄、摸球、掷币方法都属于半随机方法。临床上有些医师以患者入院的日期单号和双号、或以患者的编号奇数和偶数决定分组,也是半随机方法,这类方法简便易行。例:计划研究某城市2型糖尿病的发病率,欲从该市30个社区中随机抽样10个社区作为研究样本,先将30个社区编号1~30,同时制作仅数字不同的30个数字标签,标签被充分混匀后,按预先规定抽取10个签号,抽到的10个社区即为研究样本。

(2) 随机数字表法:

也称完全随机法,是利用一个工具表(随机数字表)进行随机抽样、随机分组、随机实验顺序的方法,此方法虽较抽签法复杂,但科学性强且可达到完全随机。随机数字表是通过计算机随机产生的数字编制而成(附表1),表中各个数字都是彼此独立的,无论从横向、纵向或斜向的顺序,数字都是随机出现。使用时可以在任意一行任意一列或斜方向从任意一个数字开始按顺序取用所需要的随机数。例如:要将15只受试动物等分到A、B、C三组,先将动物编号1~15号。再查随机数字表,从第16行第11个随机数开始,从左至右逐个抄录15个两位数的随机数,按顺序依次分配至受试动物1~15编号下。事先规定,以3(分三组)除每个随机数,余数为0者分到A组;余数为1分到B组;余数为2者分到C组。初步分组如下(表3-1):
表3-1 15只动物完全随机化分组
初步分组结果:A组为1,3,9,12,13,15号动物,B组有4,5,7,8,10号动物,C组是2,6,11,14号动物。从初步分组结果分析A组多1只(6只),C组少1只(4只),故需从A组调整1只到C组各组才均等。继续查随机数字表,在上述第15个随机数字90后的一个随机数是16,用随机数16除以A组动物数6,余数为4,则应将A组第4个动物(即第12号动物)调至C组,使三组动物数相等。最终分组如下,A组:1、3、9、13、15号,B组:4、5、7、8、10号,C组:2、6、11、14、12号。

(3) 分层随机法:

完全随机法虽然在一定程度上保证了各组之间的均衡性,如果受试对象有年龄、性别、窝别等可能影响实验结果的混杂因素存在,且在个体之间的变异较大,则难以保证各组之间的均衡性。例如:动物数量比较大,且有雌雄两种性别动物或不同窝别、不同年龄的动物,随机分组时则要按雌、雄分别编号(或按不同窝别、不同年龄组分别编号),再按随机数字表法将不同性别、不同年龄、不同窝别的动物均等随机分配到各组,此称为分层随机法。分层的原则是层间的差异要大,层内的差异要小。分层随机法可以更好地均衡各组非处理因素。配对随机化、区组随机化可看成是分层随机的实际应用。

3.随机性检查

上述抽签法易受阄形、签形与硬币的对称性、概率等因素的影响,不能达到完全随机。因此对于半随机法获得的分组(抽样)结果,尚需进行随机性检查。样本的随机性检查采用游程检验,当检验统计量 τ<1.96,即 P>0.05时,表示这种样本分配是随机的;当 τ≥1.96,即 P≤0.05时,则样本分配不是随机的。只有游程检验证明是随机的,由此获得的资料才能进行统计学处理。

(三) 重复原则

重复(replication)是指在相同条件下,进行多次实验或观察,重复程度表现为样本含量的大小和重复观察或实验次数的多少。重复原则有两层含意:一是指实验的样本含量必须足够大,在相同实验条件下有充分的重复,以避免实验结果的偶然性,表现出必然规律;二是指任何实验结果的可靠性应经得起重复实验的考验,重复实验是检查实验结果可靠性的唯一方法,科学实验的重要特征之一是它的再现性或可重复性,一个不可重复的研究是没有科学性的。

1.重复的意义

重复的意义在于控制抽样误差,保证结果的可靠性。实验结果都具有误差,误差自始至终存在于一切科学实验的过程中。对照和随机化在很大程度上能消除、减少非处理因素所造成的误差,但由于个体变异和各种偶然因素的影响,有可能把个别情况误认为普遍现象,把偶然性或巧合现象当成必然规律,只有多次重复观测受试对象的某项指标,才能通过该指标观测值的差异估计误差大小,掌握该指标的变异规律。在抽样研究中,由于生物的个体变异必然会产生抽样误差,从反映抽样误差大小的标准误的计算公式( )可以看出:抽样误差的大小与样本含量( n)的平方根成反比,即样本含量越大(重复数越多),抽样误差就越小,增加重复数可以降低抽样误差。但并不是重复越多越好,无限地增加样本含量会加大控制实验条件的困难,增加系统误差出现的可能性,同时造成不必要的人力物力浪费。究竟多大样本含量时既能降低误差、显示变异的客观情况又不致浪费,这需要通过正确方法估算实验所需要的最小样本例数,即样本含量的大小。

2.样本含量估计

样本含量估计是个比较复杂的问题,方法有公式计算法和查表法,但不论按何种方法得到的结果都只是近似的估计值。
在进行样本含量估计时,首先要了解影响样本含量大小的因素,其次需要明确进行样本含量估计的条件,正确选择样本含量估计的计算公式或工具表。样本含量估计的具体方法见本书第六章。