临床检验质量控制技术(第3版)
上QQ阅读APP看书,第一时间看更新

第一节 基本概念和定义

当按五项关键要点执行时,成功的方法评价就能实现(表11-1)。方法选择和评价过程必须开始于临床。评价过程应寻求知道候选方法是否具有足够的分析重复性和准确度来产生结果,使其为临床所用。统计的和经济的考虑也是重要的,但是要与临床方面进行比较。例如,对于方法评价需要统计技术,但是统计的显著性意义并不能提供判断方法的可接受性的基础。关于接受或拒绝的决定应基于数据可进行的误差的估计,并被临床所接受。实验成本的压力也特别重要,但不是唯一因素,在选择候选方法时需要对其进行考虑。
建立检测的需求是选择候选方法的第一步(图11-1)。这种需求可能由以下情况提出:①临床医师的建议考虑增加新的诊断试验;②新方法与已存在的方法相比,将提供改进的正确度或精密度;③用更有效的程序替换老的、劳动强度大的检测方法。
在开始时,通过仔细地描述候选方法的要求,选择和评价的过程以直接和有效的方式来进行。因此,这些要求指导选择评价分析方法的全过程。这一过程是质量管理连续环中质量计划分量的一部分。
表11-1 新方法成功评价的关键点
(一)实践要求
在决定是否将新的方法或仪器在某一实验室执行前,首先必须考虑一些实际的因素,包括标本类型、样本量、分析能力、周转时间、试验菜单、标本处理、分析批的大小、人员技能要求、每一试验的成本、校准方法、校准频率、随机处理能力,质控方法、空间需求(包括试剂贮存)、废物处理要求以及化学危险物和安全的考虑。通过分析人员、监督人员和主任之间的讨论使实验室人员能确定大多数的实际要求。实际的信息也可从描述方法或仪器的文献中获得。很明显,如候选方法的实际特征与实验室的要求不一致的话,其将不会被采用。
(二)性能参数
与方法或仪器性能有关的特征包括其正确度、分析范围、分析回收、分析灵敏度、分析特异度、空白读数、检出限、干扰、精密度、试剂稳定性、“稳健性”及样本的交互作用等。对这些参数的评价来评价方法的性能;这些研究的结论随后可作为临床使用是否可接受的基础。“医学实用性”的定义要求实验室人员与临床人员进行交流。性能要求取决于试验结果的预期用途或在其医学上不同的应用;因此,可产生不同的正确度和精密度的目标。
1.准确度(accuracy)
国际临床化学联合会(IFCC)将准确度定义为分析项目测定值与其“真值”之间的一致性。实际上,分析项目的真值可使用不同的参考方法技术获得。然后通过使用系统误差或总误差概念来确定方法的准确度,并由它评价分析项目真值与其测定值之间一致性。
(1)参考方法:
许多组织已参与开发临床上分析物的准确度。例如,美国国家临床检验参考系统(NRSCL)从事开发临床上感兴趣分析物可溯源的准确度库——已有证书的参考系统有12个分析物,其列于表11-2中。美国临床化学协会标准委员会在互联网上提供了标准和参考方法的信息(http://www.aacc.org)。
美国国家临床检验参考系统以分析方法和参考物质层状结构为基础开发了准确度库,允许服务实验室评价候选方法的准确度。这些包括(按准确度降低的顺序)决定性方法,参考方法、可比较的方法均值,参考实验室均值,以及同组的均值(基于方法组的均值)。
表11-2 推荐允许误差
续表
续表
续表
续表
续表
1)决定性方法(definitivemethods):指的是与某些绝对的物理量有关系,如质量。它们被用于检测物质来提供与分析物真值最接近的值。向血清样本中加入已知量核素标记的分析物被再用质谱法测定称为核素稀释质谱法,这是用于决定性方法的常见技术。已校准的质量分光光度计允许确定未标记分析物的量和已标记分析物的量的比值。这些量的比值可计算出未知的量。美国国家标准和技术研究院(NIST)已正在开发决定性方法,并且此项计划持续了几年。有些专业小组已与美国国家标准和技术研究院合作开发新的决定性方法,来生产标准参考物质(SRM)使得具有已知分析值的样本的广为应用成为可能。
2)参考方法(referencemethods):是在工业和临床实验室由有经验的工作人员执行的更高精度的方法。参考方法的结果可溯源到决定性方法。由决定性方法验证的一级参考物质被用于参考方法的开发和校准。
3)比较方法均值(comparativemethod means):是选择方法能力验证试验结果的平均值。它们可通过使用不同的仪器和技术的多个实验室产生的平均结果获得。将测量值与这些平均值作比较是评价测量准确度的常见方法。选择用于计算比较方法的平均值的方法,因为多年来它们具有可靠的性能。证据表明这些公议值经常与近似的真值非常接近。
4)同组均值(peer group means):是从几个使用相同仪器和技术的实验室获得的室间质量评价(能力验证)试验结果的平均值。同组均值可允许实验室通过与使用相同仪器的其他实验室比较来评价自己仪器的准确度。此种方法,实验室依赖于厂家来描述方法与某些准确度更独立测量之间的关系。
(2)系统误差(systematic error)概念:
系统误差是测定量与真值的一致性的度量。正确度的估计通常是通过方法学比较试验,即评价的方法与准确度已建立和确认的方法同时检测临床标本。正确度(trueness)和偏倚(bias)常被用来强调比较方法之间的缺乏一致性。对于给定的方法,系统误差可为正或负偏倚,其不同于随机误差,其出现正和负两方向。
系统误差可再分为两种类型,即固定的和比例的误差。固定的系统误差指的是即使分析物浓度改变但仍处于同一大小;而比例系统误差大小是分析物浓度的百分数。当在某些样本存在干扰物质时可发生固定系统误差。系统误差的大小和类型可通过方法比较试验来估计。
固定和比例系统误差是可以检出的,并可以通过绘制试验方法的结果与一组样本的“真值”之间的关系图清楚地显示(图11-2)。在图A中,随机误差显示的离散数据围绕拟合的线性。图B中,固定误差造成在同一方向的偏移,其可通过线与Y轴的交点(Y轴截距)来定量估计。比例误差造成线的斜率偏离理想的45°角。因此,仔细地检查关系图能提供有关这些分析误差分量的有价值的信息。
另一个有用的工具是检查系统误差的“偏倚图”,其是以试验和参考方法之间的差值(偏倚)为Y轴,参考方法的结果为X轴的图形。偏倚图可以直观地检查偏倚在整个值范围内是否是固定的,或偏倚是否受到方法之间差值的影响。然而,这些图形并不能像图11-2那样对固定和比例误差容易地作出解释。
图11-2 A.直线的随机误差的显示;B.固定和比例类型系统误差的表现
(3)总误差(total error)概念:
当试图识别误差来源和降低其大小时,关于不同误差分量的信息是很有价值的。另一方面,在判断新方法时必须考虑的是误差分量的整体效果或总误差。许多误差分量具有相加性;因此,最终的试验结果的误差量大于任何单个的误差。实际上,确定的是总误差,分析质量所应达到的,以及方法最终的可接受性是其临床应用。
总误差概念和其与随机和系统误差之间关系如图11-3所示。围绕中央值的分布表示随机误差,而分布的中央值偏离其真值表示系统误差。
图11-3 总误差概念
2.分析范围(analytical range)
这种参数指的是“方法应用未经修改样本的浓度范围或其他量”。通过线性试验,即候选方法检测含较宽范围的特定分析物量的参考溶液。理想情况下,校准曲线(响应对分析物浓度之间关系图)应该是线性并通过原点。如果曲线是线性,检测范围被称为方法的线性范围。如果无法获得线性响应,校准程序应使用足够的较高校准溶液数量来确定响应曲线,并且校准溶液应包括未知浓度。方法的分析范围应足够的宽,包括没有预稀释期望样本的95%~99%。正如美国临床实验室改进修正案1988最终规则(CLIA’88)所规定,一旦已确认了方法的分析范围,它就是方法的可报告范围。
3.分析灵敏度(analytical sensitivity)
国际理论和应用化学联合会(IUPAC)将方法的分析灵敏度定义为校准曲线的斜率及对于规定量的变化分析程序产生信号的变化。基本上,这一词语定量了相对于分析物量、浓度或特性的变化的信号变化。对于词语“分析灵敏度”和“检出限”经常是混淆甚至是误用。存在这种混淆是因为词语是互相关联——两者认为是方法“敏感”的特性。实际上,理想的方法是描述为具有高的分析灵敏度水平和低的检出限。
4.分析特异性(analytical specificity)
这一词语是与准确度相关联,指的是分析方法只对分析物,而对其他相关的物质不起作用的能力。例如,如果存在类似的己糖(如:甘露糖和半乳糖)时,葡萄糖方法仅准确地测量葡萄糖,则此方法将是特异的。类似的,当抗体与类似的分子无交叉反应时,免疫化学方法也可以说是分析物特异的。分析的特异性也可受到血清或血浆中胆红素、血红蛋白和脂类等物质的影响。这些成分可能通过它们的颜色、浊度或其他物理或化学特性来影响方法。
5.空白测定(blank measurements)
在测量程序过程中由于试剂和样本成分而观察到的响应被认为是“空白测量”。通过下列试验可获得这些值:①没有样本试剂溶液(即试剂空白);②样本溶液和缺少关键试剂的溶液(即样本空白)。
6.检出限(detection limit)
国际理论和应用化学联合会(IUPAC)将检出限定义为给定分析程序具有适当的确定检出的分析物的最小浓度或量。检出限依赖于空白读数大小,并且被认为与这些测量的精密度有关系。
7.干扰(interference)
干扰描述的是除了分析物以外,某些其他成分的影响或一组成分对分析物测量的准确度的影响。例如葡萄糖氧化酶反应测量葡萄糖,其中产物过氧化氢可能与尿酸而不是期望的色团起反应。干扰可能是轻微的,例如药物的存在与某些叠氮试剂起反应。很明显,对于给定的分析方法对所有可能的干扰进行检验是很困难的,并且是不可能的。为了支持这一过程,美国临床和实验室标准研究院(CLSI)已出版了描述如何执行方法干扰试验的文件。并且可获得一系列药物及它们如何对许多临床实验室试验干扰的信息。Kroll和Elin已综述了干扰的重要性。
8.精密度(precision)
分析方法对同一样本产生重复测量相同值的能力被称为它的精密度,也被称为随机分析误差。精密度通常由同一材料至少分析20次并且计算标准差的重复试验来估计。可估计出不同的精密度分量,其依赖于如何执行试验。批内精密度是在同一分析批内重复地分析同一样本的变异性,或对一系列的临床标本在同一批内进行双份检测并计算双份测定的标准差。批内精密度通常过低地估计了总的精密度,因为在重复检测时间内变异的条件的机会最小。当在同一天内在几个不同批重复检测同一样本时,可估计日内精密度或批间精密度。这种变异性通常要比观察到的批内重复的变异性要高些。日间精密度是当在不同天重复检测同一样本获得的变异性。最后的估计值是性能的最实际的评价,因为它包括了由于不同操作人员、仪器日间的变化、不同移液器的使用以及实验室的温度或其他条件的变化而导致方法性能的改变。所有这三种类型精密度的分量可通过方差分析(ANOVA)计算进行估计。美国临床和实验室标准研究院(CLSI)文件已描述如何使用方差分析(ANOVA)估计每一精密度分量。实际上,可以通过使用不精密度这一词语来代替精密度,因为它可以定量重复测量发生的变异性。
9.回收(recovery)
回收是指当已知量物质加入真实样本中,正确地测量分析物的能力。回收测量是获得准确度信息的一种有效的方法,因为它可检验在真实样本的基质中存在所有其他成分分析方法是否能检测分析物。回收试验也可对竞争性的干扰(如对于检测血清钙采用结合染料法的钙与蛋白的竞争)进行检验。
遗憾的是,回收试验常执行得很差,并且对数据进行了不适当的计算。同样的,应该注意另外加入纯物质很明显是人工的方法;不能肯定分析物的物理或化学性状(即它的溶解性和与血清蛋白结合力)或代谢环境(如在肝脏中结合)与在体内的结合一样。然而,当分析参考方法和参考物质受到局限或不可获得时,回收试验可以说是评价准确度的唯一实际的方法。