第四节 设定质量规范的策略
在层次模式中并没有包括所有的设定质量规范的策略。在文献中,特别是标准教材中,已发现某些模式有许多缺陷,应考虑淘汰。
可获得的模式由专业人员认为仍然具有其优点按分层的方式表示,如表2-1。然而,包含的任何特定的策略并不意味着其没有任何缺陷。
一、特定临床情况下的质量规范
理想情况下,质量规范应由评价分析性能对特定临床决策影响并以数字方式导出。因此,对每一试验及每一临床情况,我们导出的质量规范直接与临床结果相关联。这种方法几乎是处在层次中的最上层。遗憾的是,这种方法是非常难的,仅在有限数量的不同的临床情况下对很少的分析物进行计算。
让我们考虑血清胆固醇用于筛查试验,且假定有如图2-4所示的真实总体分布的理论实例。我们假定血清胆固醇具有高斯分布,关于临床措施的固定浓度具有广泛的一致性。
图2-4 偏倚对血清胆固醇检测结果影响
如果实验室分析偏倚是正的,则曲线将向右移动,如图2-4中间的图形所示。现在总体中有更多的部分高于选定的临床决策固定限,包括真正高于固定限的血清胆固醇浓度的个体,及由于正的分析偏倚导致高浓度的个体。因此,将出现“假阳性”的结果。
因此,分析本身的性能特征影响临床结果。例如,协商的临床指南规定的政策是对血清胆固醇高于固定限的每一个人进行饮食的建议,然后召回到门诊、药物治疗,进行进一步的实验室检测及追访,甚至简单地重复试验,这将导致花费在卫生保健资源超出所需。高于预期比例的人群将被标记为“高风险人群”,其中一些人是由于分析偏倚所导致的错误划分。
与此相反,如果实验室的偏倚是负的,曲线将向左侧移动。如图2-4最下面图形的显示结果。由于偏倚,某些人的实际血清胆固醇浓度高于临床行动的固定限,但是却得出了较低的值。因此,“假阴性”的数量将增加。这将导致在短期上由于没有额外的试验和药物的成本节约,但是从长期方面潜在地导致巨额成本,正如人群中的某些人失去了对早期冠心病的最初的检测。
正偏倚和负偏倚对高危人群比例的影响可从高斯分布简单计算知识导出:通过计算在固定界限内和外的人群所占百分数,及对一些偏倚计算这些值。然后,就可计算出分析偏倚和高危人群百分比增加和降低之间的关系,如图2-5所示。
图2-5 正和负偏倚与假阳性和假阴性个数提供产生质量规范方法之间的关系
如果我们根据允许错误划分百分比来规定医学要求,允许的分析偏倚-质量规范就很容易通过插入方式获得。在本实例中,如果临床医生同意5%人群不正确地划分是满意的话,我们将允许的分析偏倚可达到±3%~4%。
注意:这种方法给出偏倚质量规范。可执行类似(但更困难)的计算来检查不精密度对临床结果的影响。然而,当使用固定限进行试验解释时偏倚是最重要的性能特征。
将这种清楚的临床策略规定为一种设定质量规范可能的最好方法。
然而,主要的缺点是大多数的试验结果用在多种临床情况下,且只有很少的试验用在单一明确的临床情况下,其标准化可接受的医学策略直接与试验结果相关。另一重要的缺点就是计算的质量规范很大程度上依赖于临床医生如何使用数字的试验结果。我们已试图询问临床医生他们实际上如何使用有限的临床情况解释试验,如检测糖尿病的糖化血红蛋白A1c,但是他们不愿意或不能以特定的名词在实际上规定,在临床实践上如何精确地使用试验结果。
二、基于试验结果一般临床使用的质量规范
我们知道临床实验室试验结果可用于许多场合。使用试验结果的两种主要临床情况:①监测特定患者;②使用参考区间进行诊断或发现病例。一般可应用的质量规范是基于生物学变异,即个体内和个体间生物学变异。
在本组中(层次中的第二层)的第二种方法的基础是通过寻求临床输入我们能产生一般的质量规范的观点。在过去,只有很少的研究是这样做的,而且一般而言,相当的差。然而,观念是很不错的:临床医生使用我们的试验结果,这样他们应该能够告诉我需要什么样的质量。因此,这一策略产生质量规范基于感知的医学需求。在试验结果常规解释的基础上,我们计算质量规范基于临床医生对一系列短期病例研究作出的反应。应用实例如下:
一位63岁的老人,男性,高血压,胆固醇浓度为6.60mmol/L。对他的建议是改变生活方式,包括饮食的改变。两个月后您对他的评论。
血清胆固醇浓度应该是多少表示他已采取你的建议?
调查临床医生最好的方法应采用如下步骤:
(1)理想情况下,选择单一试验和单一主要的临床情况,所要求的质量规范。
(2)然后选择一组临床医生定期地使用分析。
(3)写出一系列病史,描述常见、相对明确的临床情况,其分析物是患者保健的至关重要的部分。
(4)亲自一对一与医生交流,向临床医生分发调查表。
病史是关于患者具有明确的临床状况。对于特定患者要给出第一次结果。然后,询问临床医生给出特定的值,被认为是足够地不同于第一次值,这样修改临床决策。第一次值可能是在常规参考区间或基于总体的参考界限内或外。
三、从对临床描述的响应中计算精密度质量规范
执行数据分析要求的详细计算是很容易的。既然我们在此关注的随时间的过去单个受试者(对象)的变化,在这种情况下重要的性能特征是精密度而不是偏倚,尽管后面还会见到,偏倚应包括在内。其研究步骤如应用前面描述的65岁男人研究的步骤如下:
(1)核对整理回复或回答。
(2)计算6.60与响应之间的差值。
(3)计算差值的频数分布。
(4)计算差值的中位数、第25%位数、第75%位数。
(5)决定概率大小表明和发现适当的Z-值。
(6)从文献中找到个体内生物学变异。
(7)在期望的概率水平上计算出作出临床决策所要求的分析性能。
(8)使用差值的中位数、25%位数、75%位数来建立三种水平的质量规范:适当的、最适当的和最低的。
临床医生已告诉我们什么样的变化是临床上有意义的,然后我们考虑概率,其必须是适合提交给临床医生问题的语义,因为不同用词意味着不同水平的概率。此外,给定差值建议有意义是在特定个体的系列结果的基础上,这些差值包括生物变异。个体内生物学变异,必须考虑从广泛的文献中进行收集。
即使对于特定的临床情况下单个分析物,我们经常获得广泛的响应。我们通常使用响应的中位数为适当的质量规范。由响应的25%和75%位数来规定最适当的和最低的质量规范。这些质量规范通常是与适当的精密度有关。
复杂的研究可假定感兴趣的变化是由于总误差和由于精密度和偏倚将其分解。
四、来自专业人员推荐的质量规范
一些国际的和国家级的专业团体已推荐了详细的质量规范。其中有些是关于精密度,有些是关于偏倚,有些是关于允许的总误差。基于这些建议广泛采用的质量规范包括如下步骤:
(1)美国国家胆固醇教育计划专家组已发表脂类分析的精密度、偏倚和允许总误差的推荐。
(2)美国糖尿病协会文件规定自身监测血糖系统和糖化血红蛋白分析的质量规范。
(3)美国国家临床生物化学科学院已推荐甲状腺素检测、治疗药物监测及用于糖尿病和肝功能诊断和监测的试验的质量规范。甲状腺素检测指南正在审核中,且新的指南建议精密度、偏倚和允许总误差的质量规范最好是基于生物学变异,正如糖尿病和肝功能指南的一样。
(4)欧洲工作组已提议基于生物学变异用于分析系统精密度和偏倚评价的质量规范。
(5)另外,欧洲工作组已建议确认常规方法和用于能力验证或室间质量评价计划材料赋值的参考方法的质量规范,也是基于生物学变异。
这些质量规范是建立在此项研究的大量实验和临床经验基础之上,在它们发表之前,通常是对可获得的证据经过详细的讨论。这些规范的使用者可评价得出结论过程的客观性,因为得出推荐的方法是在文献中发表的。
五、准备协商一致文件的步骤
使用专家专业推荐导出质量规范指南的推荐策略方法如下:
(1)专业团体决定需求并任命专家小组成员。
(2)专家小组决定推荐范围。
(3)专业机构对范围达成协议并批准进一步的工作。
(4)专家书写文件内容。
(5)外部同行评审文件内容。
(6)校对文件。
(7)在会议(和网络)上介绍文件,征求意见。
(8)修订文件。
(9)外部同行评审重新起草的文件。
(10)在网络上张贴重新起草的文件再次进行评论。
(11)考虑适当的观点。
(12)准备最后文件。
(13)在适当的杂志上发表最终文件。
(14)广泛地发表执行摘要。
(15)在规定的未来的时间内审核文件。
在已发表的指南中已推荐了不太广泛使用的那些质量规范——“最好的实践”或“良好的实验室实践”指南。这些质量规范通常是在单个协商一致会议上提出而没有经过广泛的讨论。它们有一定的价值,它们通常是建立在某个特定机构的专家或专家组的广泛知识基础上。然而,指南通常是主观的,不常基于可接受的模型,新的方法或实验数据。这些质量规范处于国家或国际专家组推荐更下的层状结构下。
因为质量规范是完全不同的类型,有些是分别给出精密度、偏倚和允许总误差数据,其他情况仅给出这些特征中的一种情况或两种情况的数据,所以强烈建议在不适当地应用它们之前仔细地阅读有关的建议。
六、基于法规和室间质量评价的质量规范
(一)美国临床实验室改进修正案’88(CLIA’88)能力验证(室间质量评价)分析质量要求
一些国家已规定分析性能标准,为了达到可接受的标准,或达到和/或保持认可状态,实验室必须满足该标准。美国临床实验室改进法案修正案(CLIA’88)法规文件记录允许总误差,其是不精密度加偏倚,当然,只是针对一些常见的检测项目。表2-2列出一些项目。类似的法规也存在于德国。但是其质量规范完全不同于美国(例如,德国联邦法律要求不精密度小于1/12参考区间)。
这种策略的优点是CLIA’88质量规范很知名,并易于理解及广泛可获得,甚至在互联网上(www.westgard.com/clia.htm)可获得。然而,主要的缺点是CLIA’88质量要求是基于可达到的标准而不是适当的标准。此外,当法规存在及制定可接受性能标准,则实验室可以看到如适当目标达到而不是使用任何其他的质量规范。许多最近的关于质量计划的文献使用CLIA’88作为允许总误差质量规范为模型的基础。
表2-2 CLIA’88可接受性能质量规范的实例
续表
续表
(二)欧洲国家临床化学室间质量评价的评价限
欧洲各国家主要采用两种方式:一种是基于生物变异、专家意见、“固定”的目前技术水平,或结合这些观点得出的“固定限”。另一种是采用每次调查结果的统计标准,即是“可变的限”(实际技术水平限)(表2-3和表2-4)。
表2-3 欧洲室间质量评价界限标准
注:CVI=个体内生物变异,CVwlab=室内变异系数,P95=第95%位数,P99=第99%位数;CCV=选定变异系数
表2-4 欧洲不同国家临床化学室间质量评价的评价标准(百分变异)
(三)澳大利亚室间质量评价标准(表2-5~表2-11)
表2-5 血气室间质量评价标准
表2-6 内分泌室间质量评价标准
续表
续表
表2-7 常规化学室间质量评价标准
续表
续表
续表
表2-8 治疗药物监测室间质量评价标准
表2-9 糖化血红蛋白室间质量评价标准
表2-10 脂类室间质量评价标准
表2-11 肿瘤标志物室间质量评价标准
世界上许多不同的室间质量评价计划使用不同的技术判断参加实验室的可接受性或可达到的其他性能准则。有些国家分析参加实验室回报数据,应用总的或方法组公议值评价偏倚或使用计算的s或CV建立可接受的界限,通常是3s或3CV。这种情况有明显的缺陷,因为s或CV仅显示当前方法和技术所能达到的水平。
然而更多的实验室专业人员使用固定限作为可接受准则。像CLIA’88准则,一般指的是允许总误差。使用这些室间质量评价固定限作为质量规范的主要缺陷是,虽然这些质量规范是根据专家观点而定,但它们算是完全根据经验的。不同的国家使用完全不同的固定限,其支持的观点不是完全客观的。它们也清楚受到当前技术和方法学实际能达到的影响,或被称为“当前技术水平”。
尽管存在这些困难,从能力验证或室间质量评价计划关于当前技术水平的证据已在过去广泛地提倡作为质量规范,特别是当由更好的实验室可达到的性能,通常最好的20%可作为目标。根本的概念是,如果五个实验室中有一家实验室能达到这种水平的质量,则对于所有的实验室存在的技术和方法学达到的相同的分析性能。
七、基于当前技术水平的质量规范
从能力验证和室间质量评价计划组织者通常可获得关于分析上实际可达到的数据;如果没有可获得的质量规范,我们能使用这种通常可达到的当前技术水平。然而,文件记录的分析性能不可能真实地反映当前的技术水平,因为分发给参加实验室的样本由于基质效应,不能像患者样本一样。另外,实验室工作人员可能对这些样本采取特殊方式处理,试图“改进”其性能。文件记录的能力验证和室间质量评价计划当前技术水平随时间而变化(并不总是越来越好),及取得的性能可能与实际的医学需要没有关系。
通过阅读文献中的关于方法学的论著可获得当前技术水平。需要警告的是:实验室发明者或最初的评价者文件记录的性能可能是最好情况下(因为在接近理想条件下操作)而不是每天实践所能达到的。再者,分析上达到的性能可能与实际医学需要之间没有内在关系。
因此,这些方法在层状模式中处于较低位置,且所处的位置一定低于基于生物学变异的质量规范。