一、诊断试验设计
【问题1】
上述案例中的研究设计属于哪种流行病学方法?还有其他设计方法也可进行这样的诊断试验吗?它们各有何种优缺点?
思路:上述案例研究是先进行钼靶X线检查并作出诊断,后进行手术和病理组织学检查。因为肿瘤类疾病均以病理检查结果为确诊依据,所以这是一种前瞻性研究设计(类似于前瞻性队列研究),钼靶X线检查结果类似于队列研究中的暴露,病理检查结果类似于结局。
诊断试验也可以是回顾性研究设计(类似于病例对照研究)。在此案中,如果首先收集已经病理诊断的乳腺癌患者和良性乳腺病患者各若干(如100例),再采取她们的血或尿生物样品(治疗前),检测其中的某种生物标志物,根据生物标志物的值鉴别乳腺癌与非乳腺癌,就是一种回顾性研究设计。此时,病例组应是包括此类疾病所有类型的代表性样本,如轻度到重度(排除极其严重者)等不同病情严重程度、不同临床症状和体征、典型和不典型、有或无并发症的连续病例;对照组的选择最好包括容易与研究疾病混淆,需进行鉴别诊断的其他疾病,完全无病的健康人和自愿者一般要慎用。这类研究也可以在队列研究的基础上进行,即巢式病例对照研究。
另外,回顾性队列研究设计也可以用于诊断试验。在本研究案例中,如果Hansell在1985年初并没有想到做此研究,而是之后才意识到这一研究的意义,他们可以回顾性首先收集1985年进行钼靶X线检查的就诊者结果,再收集这些研究对象的病理组织学结果,同样可以得到表2-1的数据。不过,这种研究设计需要相关信息的完整历史记录。
传统回顾性与前瞻性研究的优缺点也同样存在于诊断试验的回顾性与前瞻性研究设计中,如回顾性研究较前瞻性研究样本量少和时间短,从而省时省力,但因为回顾性研究是首先获得确诊结果再进行诊断试验,故在诊断试验时容易受确诊结果的影响,从而导致信息偏倚。因此,采用回顾性研究设计时,诊断试验结果判定应采用盲法。另外,某些诊断试验无法进行回顾性设计,如在此案例中,乳腺癌手术和病理诊断后便无法进行钼靶X线检查。
【问题2】
上述案例的“金标准”是什么?金标准有何要求?
知识点
金标准
“金标准”(gold standard)是指当前国内外公认的准确性及可靠性相对最好的诊断方法,它能够肯定或排除某种疾病,也称作“参考标准”(reference standard)。
思路:本案例中乳腺癌等肿瘤的金标准便是组织病理学活检结果,其他疾病常用的金标准有手术发现、微生物培养、特殊影像检查、临床综合判断以及长期随访结果等。
【问题3】
不同的流行病学研究设计怎样选择研究对象?
思路:
1.前瞻性研究设计
传统前瞻性研究首先需要确定暴露与非暴露人群。在诊断试验中,前瞻性研究设计首先需要确定的是拟进行诊断的人群,通常在医院收集,该人群可能是具有相应症状和体征或通过筛检表现出阳性的个体,进行诊断试验后,分为阳性与阴性人群,再追踪观察,直至进行“金标准”试验。此案例中的研究人群是就诊人群,往往具有与乳腺相关的症状或体征,通过钼靶X线诊断为可疑乳腺癌和可能的良性乳腺病,再通过活体组织病理检查(金标准)获得是否患乳腺癌的结果。
2.回顾性研究设计
(1)病例:
按“金标准”确诊的病例,此案中为病理诊断的乳腺癌患者,可以来自社区或医院,但以医院新诊断病例为佳。
(2)对照:
按“金标准”确认的非该种病例,最好是需要加以鉴别的病例,如此案例中的良性乳腺病。
【问题4】
诊断试验中怎样考虑样本量问题?
思路:对每项诊断试验选择适当数量的能代表目标人群的样本,既可保证结果的可靠性,合理估算抽样误差,又可节约试验成本。影响诊断试验样本量的因素主要有:①显著性水平α:α值越小,样本量越大。②允许误差δ:δ越小,样本量越大。③灵敏度或特异度的估计值:接近50%时,样本量最大;越远离50%,样本量越小。
当灵敏度和特异度接近50%时,样本含量可用以下公式估计。
式中n为所需样本量。Zα为正态分布中累积概率等于α/2时的Z值,一般取Z0.05/2=1.96或Z0.01/2=2.58。实验允许误差δ一般取0.05~0.10。p为待评价的诊断试验的灵敏度或特异度,通常用灵敏度估计病例组所需的样本量,特异度估计对照组所需的样本量。
例如,假设待评价的诊断试验灵敏度估计为75%,特异度为90%,取α=0.05,δ=0.05,则病例组和对照组所需的样本量为:
评价该诊断试验病例组所需人数为288例,对照组为144例。实际应用中,如果考虑到可能的失访,每组可以适当再增加10%~20%的样本量。
当待评价的诊断试验的灵敏度或特异度≤20%或≥80%时,样本率的分布呈偏态分布,需要对率进行转换,用如下公式计算样本量。
上述是以病例对照设计为基础的计算方法,至于队列研究设计诊断试验的样本量计算,学术上尚无统一标准,可以通过病例对照设计的样本量,结合诊断试验的阳性率加以推算。