第八节 RECIST疗效评价标准
实体肿瘤的疗效评价标准1.1 版
(Response Evaluation Criteria in Solid Tumors RECIST Version 1.1)
一、肿瘤在基线水平的可测量性
(一) 定义
在基线水平上,肿瘤病灶/淋巴结将按以下定义分为可测量和不可测量两种:
1.可测量病灶
肿瘤病灶:至少有一条可以精确测量的径线(记录为最大径),其最小长度如下:
(1)CT扫描10mm(CT扫描层厚不大于5mm)。
(2)临床常规检查仪器10mm(肿瘤病灶不能用测径仪器准确测量的应记录为不可测量)。
(3)胸部X线20mm。
(4)恶性淋巴结 病理学增大且可测量,单个淋巴结CT扫描短径须≥15mm(CT扫描层厚推荐不超过5mm)。基线和随访中,仅测量和随访短径。
2.不可测量病灶
所有其他病灶,包括小病灶(最长径<10mm或者病理淋巴结短径≥10mm至<15mm)和无法测量的病灶。无法测量的病灶包括:脑膜疾病、腹水、胸膜或者心包积液、炎性乳腺癌、皮肤/肺的癌性淋巴管炎、影像学不能确诊和随诊的腹部包块,以及囊性病变。
3.关于病灶测量的特殊考虑
骨病灶、囊性病灶和先前接受过局部治疗的病灶需要特别注明:
(1)骨病灶
① 骨扫描,PET扫描或者平片不适合于测量骨病灶,但是可用于确认骨病灶的存在或者消失;
② 溶骨性病灶或者混合性溶骨/成骨病灶有确定的软组织成分,且软组织成分符合上述可测量性定义时,如果这些病灶可用断层影像技术如CT或者MRI进行评价,那么这些病灶可以作为可测量病灶;
③ 成骨病灶属不可测量病灶。
(2)囊性病灶
① 符合放射影像学单纯囊肿定义标准的病灶,不应因其为定义上的单纯性囊肿,而认为是恶性病灶,既不属于可测量病灶,也不属于不可测量病灶;
②若为囊性转移病灶,且符合上述可测量性定义的,可以作为是可测量病灶。但如果在同一患者体内存在非囊性病灶,应优先选择非囊性病灶作为靶病灶。
(3)局部治疗过的病灶 位于曾放疗过或经其他局部区域性治疗的部位的病灶,一般作为不可测量病灶,除非该病灶出现明确进展。研究方案应详细描述这些病灶属于可测量病灶的条件。
(二)测量方法说明
1.病灶测量
临床评价时,所有肿瘤测量都要以公制米制记录。所有关于肿瘤病灶大小的基线评定都应尽量在接近治疗开始前完成,且必须在治疗开始前的28天内(4周)完成。
2.评价方法
对病灶基线评估和后续测量应采用同样的技术和方法。除了不能用影像学检查,而仅能用临床检查来评价的病灶之外,所有病灶必须使用影像学检查进行评价。
(1)临床病灶 临床病灶只有位于浅表且测量时直径≥10 mm时才能认为是可测量病灶(如皮肤结节等)。对于有皮肤病灶的患者,建议用含有标尺测量病灶大小的彩色照片作为存档。当病灶同时使用影像学和临床检查评价时,由于影像学更客观且研究结束时可重复审阅,应尽可能选用影像学评价。
(2)胸部X线片 当肿瘤进展作为重要研究终点时,应优先使用胸部CT,因为CT比X线更敏感,尤其对于新发病灶。胸部X线片检测仅当被测量病灶边界清晰且肺部通气良好时适用。
(3)CT、MRI CT是目前用于疗效评价最好的可用可重复的方法。本指导原则对可测量性的定义建立在CT扫描层厚≤5mm的基础上。如果CT层厚大于5mm,可测量病灶最小应为层厚的2倍。MRI在部分情况下也可接受(如全身扫描)。
(4)超声 超声不应作为一种测量方法用于测量病灶大小。超声检查因其操作依赖性,在测量结束后不具备可重复性,不能保证不同测量间技术和测量的同一性。如果在试验期间使用超声发现新病灶,应使用CT或者MRI进行确认。如果考虑到CT的放射线暴露,可以使用MRI代替。
(5)内镜 腹腔镜检查:不建议使用这些技术用于肿瘤客观评价,但这种方法在取得的活检标本时可以用于确认完全缓解,也可在研究终点为完全缓解后复发或手术切除的试验中,用于确认复发。
(6)肿瘤标志物 肿瘤标志物不能单独用来评价肿瘤客观缓解。但如果标志物水平在基线时超过正常值上限,用于评价完全缓解时必须回到正常水平。因为肿瘤标志物因病而异,在将测量标准写入方案中时需考虑到这个因素。有关CA-125缓解(复发性卵巢癌)及PSA(复发性前列腺癌)缓解的特定标准已经发表。且国际妇科癌症组织已制定了CA-125进展标准,即将被加入到卵巢癌一线治疗方案的肿瘤客观评价标准中。
(7)细胞学/组织学技术 在方案规定的特定情况下,这些技术可用于鉴定部分缓解和完全缓解(如生殖细胞肿瘤的病灶中常存在残留的良性肿瘤组织)。当渗出可能是某种疗法潜在的副反应(如使用紫杉烷化合物或血管生成抑制剂的治疗),且可测量肿瘤符合缓解或疾病稳定标准时,在治疗过程中肿瘤相关的渗出出现或加重,可通过细胞学技术来确诊,以区分缓解(或疾病稳定)和疾病进展。
二、肿瘤缓解的评估
1.靶病灶评估
(1)完全缓解(CR) 所有靶病灶消失,全部病理淋巴结(包括靶结节和非靶结节)短直径必须减少至<10mm。
(2)部分缓解(PR) 靶病灶直径之和比基线水平减少至少30%。
(3)疾病进展(PD) 以整个实验研究过程中所有测量的靶病灶直径之和的最小值为参照,直径和相对增加至少20%(如果基线测量值最小就以基线值为参照);除此之外,必须满足直径和的绝对值增加至少5mm(出现一个或多个新病灶也视为疾病进展)。
(4)疾病稳定(SD) 靶病灶减小的程度没达到PR,增加的程度也没达到PD水平,介于两者之间,研究时可以以直径之和的最小值作为参考。
2.靶病灶评估的注意事项
(1)淋巴结 即使鉴定为靶病灶的淋巴结减小至10mm以内,每次测量时仍需记录与基线对应的实际短直径的值(与基线测量时的解剖平面一致)。这意味着如果淋巴结属于靶病灶,即使达到完全缓解的标准,也不能说病灶已全部消失,因为正常淋巴结的短直径就定义为<10mm。在CRF表或其他的记录方式中需在特定位置专门记录靶淋巴节病灶:对于CR,所有淋巴节短直径必须<10mm;对于PR、SD和PD,靶淋巴节短直径实际测量值将被包含在靶病灶直径的和之中。
(2)小到无法测量的靶病灶 临床研究中,基线记录过的所有病灶(结节或非结节)在后面的评估中都应再次记录实际测量值,即使病灶非常小(如2mm)。但有时候可能太小导致CT扫描出的图像十分模糊,放射科医生也很难定义出确切的数值,就可能报告为“太小而测量不到”。出现这种情况时,在CRF表上记录上一个数值是十分重要的。如果放射科医生认为病灶可能消失了,那也应该记录为0mm。如果病灶确实存在但比较模糊,无法给出精确的测量值时,可默认为5mm(注:淋巴结出现这种情况的可能性不大,因其正常情况下一般都具有可测量的尺寸,或者像在腹膜后腔中一样常常为脂肪组织所包绕;但是如果也出现这种无法给出测量值的情况,也默认为5mm)。5mm的默认值源于CT扫描的切割厚度(这个值不因CT不同的切割厚度值而改变)。由于同一测量值重复出现的概率不大,提供这个默认值将降低错误评估的风险。但需要重申的是,如果放射医生能给出病灶大小的确切数值,即使病灶直径小于5 mm,也必须记录实际值。
(3)分离或结合的病灶 当非结节性病灶分裂成碎片状时,将各分离部分的最长径加起来计算病灶的直径之和。同样,对于结合型病灶,通过各结合部分间的平面可将其区分开来,然后计算各自的最大直径。但如果结合得密不可分,最长径应取融合病灶整体的最长径。
3.非靶病灶的评估
这部分对非靶病灶肿瘤的缓解标准进行了定义。虽然一些非靶病灶实际可测量,但无须测量,只需在方案规定的时间点进行定性评估即可。
(1)完全缓解(CR) 所有非靶病灶消失,且肿瘤标记物恢复至正常水平。所有淋巴结为非病理尺寸(短径<10mm)。
(2)非完全缓解/非疾病进展 存在一个或多个非靶病灶和(或)持续存在肿瘤标记物水平超出正常水平。
(3)疾病进展 已存在的非靶病灶出现明确进展。(注:出现一个或多个新病灶也被视为疾病进展。)
4.关于非靶病灶进展评估的特别注意事项
(1)关于非靶病灶进展的定义补充解释 当患者存在可测量非靶病灶时,即使靶病灶评估为稳定或部分缓解,要在非靶病灶的基础上作出明确进展的定义,必须满足非靶病灶整体的恶化程度已达到必须终止治疗的程度。而一个或多个非靶病灶尺寸的一般性增大往往不足以达到进展标准,因此,在靶病灶为稳定或部分缓解时,仅依靠非靶病灶的改变就能定义整体肿瘤进展的情况几乎是十分稀少的。
(2)当患者的非靶病灶均不可测量时 在一些Ⅲ期试验中,当入选标准中没有规定必须存在可测量病灶时,就会出现这种情况。整体评估还是参照上文标准,但因为这种情况下没有病灶的可测量数据。非靶病灶的恶化不容易评估(根据定义:必须所有非靶病灶都确实无法测量),因此当非靶病灶改变导致整体疾病负荷增加的程度相当于靶病灶出现疾病进展时,依据非靶病灶作出明确进展的定义,需要建立一种有效的检测方法来进行评估。如描述为肿瘤负荷增加相当于体积额外增加73%(相当于可测量病灶直径增加20%)。又比如腹膜渗出从“微量”到“大量”;淋巴管病变从“局部”到“广泛播散”;或在方案中描述为“足够至改变治疗方法”。例子包括胸膜渗出液从痕量到大量,淋巴受累从原发部位向远处扩散,或者在方案中可能被描述为“有必要进行治疗方面的改变”。如果发现有明确的进展,该患者应该在那个时点总体上视为疾病进展。最好具有客观标准可适用于不可测量的病灶的评估。
注意:增加的标准必须是可靠的。
5.新病灶
新的恶性病灶的出现预示着疾病的进展,因此针对新病变的一些评价是非常重要的。目前没有针对影像学检测病灶的具体标准,然而一种新的病灶的发现应该是明确的。比如说,进展不能归因于影像学技术的不同,成像形态的改变,或者肿瘤以外的其他病变(如:一些所谓新的骨病灶仅仅是原病灶的治愈或原病灶的复发)。当患者的基线病灶出现部分或完全反应时,这一点非常重要的,例如:一例肝脏病灶的坏死可能在CT报告上定为新的囊性病变,而其实不是。
在随访中已检测到的而在基线检查中未发现的病灶将视为新的病灶,并提示疾病进展。例如,一个在基线检查中发现有内脏病灶的患者,当他做CT或MRI的头颅检查时发现有转移灶,该患者的颅内转移病灶将被视为疾病进展的依据,即使他在基线检查时并未做头颅检查。
如果一个新的病灶是不明确的,比如因其形态小所致,则需要进一步的治疗和随访评价以确认其是否是一个新的病灶。如果重复的检查证实其是一个新的病灶,那么疾病进展的时间应从其最初发现的时间算起。
病灶进行FDG-PET评估一般需要额外的检测进行补充确认,FDG-PET检查和补充CT检查结果相结合评价进展情况是合理的(尤其是新的可疑疾病)。新的病灶可通过FDG-PET检查予明确的,依据以下程序执行:
(1)基线FDG-PET检查结果是阴性的,接下来随访的FDG-PET检查是阳性的,表明疾病的进展。
(2)没有进行基线的FDG-PET检查,后续的FDG-PET检查结果是阳性的。
① 如果随访的FDG-PET阳性检查结果发现的新的病变灶与经CT检查结果相符,证明是疾病进展。
② 如果随访的FDG-PET阳性检查结果发现的新的病变灶未能得到CT检查结果的确认,需再行CT检查予以确认(如果得到确认,疾病进展时间从前期FDG-PET检查发现异常算起)。
③ 如果随访的FDG-PET阳性检查结果与经CT检查已存在的病灶相符,而该病灶在影像学检测上无进展,则疾病无进展。
6.评估缺失和不可评价说明
如果在某个特定时间点上无法进行病灶成像或测量,则该患者在该时间点上无法评价。如果在一个评价中只能对部分病灶进行评价,通常这种情况视为在那个时间点无法评价,除非有证据证实缺失的病灶不会影响指定时间点的疗效反应评价。
7.疗效评估的特别提示
当结节性病灶被包括在总的靶病灶评估中,同时该结节大小缩小到“正常”大小时(<10mm),它们依然会有一个病灶大小扫描报告。为了避免过高评估基于结节大小增加所反映的情况,即便是结节正常,测量结果也将被记录。正如前面已经提及的,这就意味着疗效为完全缓解的受试者,CRF表上也不会记录为0。
若试验过程中需要进行疗效确认,重复的“不可测量”时间点将使最佳疗效评估变得复杂。试验的分析计划必须说明,在确定疗效时,这些缺失的数据/评估可以被解释清楚。比如,在大部分试验中,可以将某受试者PR-NE-PR的反应作为得到了疗效确认。
当受试者出现健康情况整体恶化要求停止给药治疗,但是没有客观证据证明时,应该被报道为症状性进展。即便在治疗终止后也应该尽量去评估客观进展的情况。症状性恶化不是客观反映的评估描述:它是停止治疗的原因。那样的受试者的客观反应情况将通过表1-7~表1-9所示的目标和非目标病灶情况进行评估。
定义为早期进展,早期死亡和不可评估的情况是研究特例,且应该在每个方案中进行明确的描述(取决于治疗间期和治疗周期)。
在一些情况下,从正常组织中辨别局部病灶比较困难。当完全缓解的评估基于这样的定义时,我们推荐在进行局部病灶完全缓解的疗效评估前进行活检。当一些受试者局部病灶影像学检测结果异常被认为是代表了病灶纤维化或者瘢痕形成时,FDG-PET被当作与活检相似的评估标准,用来对完全缓解进行疗效确认。在此种情况下,应该在方案中对FDG-PET的应用进行前瞻性描述,同时以针对此情况专科医学文献的报告作为支持。但是必须意识到的是由于FDG-PET和活检本身的限制性(包括二者的分辨率和敏感性高低),将会导致完全缓解评估时的假阳性结果。
表1-7 时间点反应:有靶病灶的受试者(包括或者不包括非靶病灶)
表1-8 时间点反应:仅有非目标病灶的受试者
注:对于非目标病灶,“非CR/非PD”是指优于SD的疗效。由于SD越来越多作为评价疗效的终点指标,因而制定非CR/非PD的疗效,以针对未规定无病灶可测量的情况。
对于不明确的进展发现(如非常小的不确定的新病灶;原有病灶的囊性变或坏死病变)治疗可以持续到下一次评估。如果在下一次评估中,证实了疾病进展,进展日期应该是先前出现疑似进展的日期。
表1-9 CR和PR疗效需要确认的最佳总缓解
① 如果在第一个时间点CR真正出现,在随后的时间点出现的任何疾病,那么即便相对于基线该受试者疗效达到PR标准,其疗效评价在之后的时间点仍然为PD(因为在CR之后疾病将再次出现)。最佳缓解取决于是否在最短的治疗间隔内出现SD。然而有时第一次评价为CR,但随后的时间点扫描提示小病灶似乎依然出现,因而实际上受试者疗效在第一个时间点应该是PR而不是CR。在这种情况下,首次CR判断应该被修改为PR,同时最好的反应是PR。
注:CR即是完全缓解,PR是部分缓解,SD是疾病稳定,PD是疾病进展,NE即不可评价。
8.疗效评估/缓解期的确认
(1)疗效确认 对于以肿瘤缓解疗效为主要研究终点的非随机临床研究,必须对PR和CR的疗效进行确认,以保证疗效不是评价失误的结果。以疾病稳定或者疾病进展为主要研究终点的研究中,不再需要疗效确认,因为这对于试验结果的解释没有价值。SD的情况下,在试验开始后的最短时间间隔内(一般不少于6~8周),至少有一次测量符合方案中规定的SD标准。
(2)总缓解期 总缓解期是从测量首次符合CR或PR(无论哪个先测量到)标准的时间到首次真实记录疾病复发或进展的时间(把试验中记录的最小测量值作为疾病进展的参考)。总完全缓解时间是从测量首次符合CR标准的时间到首次真实记录疾病复发或进展的时间。
(3)疾病稳定期 是从治疗开始到疾病进展的时间(在随机化试验中,从随机分组的时间开始),以试验中最小的总和作为参考(如果基线总和最小,则作为PD计算的参考)。疾病稳定期的临床相关性因不同研究和不同疾病而不同。如果在某一特定的试验中,以维持最短时间稳定期的患者比例作为研究终点,方案应特别说明SD定义中两个测量间的最短时间间隔。
注意:缓解期、稳定期以及PFS受基线评价后随访频率的影响。定义标准随访频率不属于本指导原则范围。随访频率应考虑许多因素,如疾病类型和分期、治疗周期及标准规范等。但若需进行试验间的比较,应考虑这些测量终点准确度的限制。
9.PFS/TTP
晚期肿瘤许多试验以PFS或者TTP作为主要研究终点。如果方案要求所有患者都有可测量病灶,进展评价就相对简单。越来越多的试验允许有可测量病灶和无可测量病灶的患者都可以进入试验。在这种情况下,必须对无可测量病灶患者疾病进展的临床发现进行详细明确的描述。因为进展日期常有确定偏差,各试验组的观测时间点安排应该相同。
(杨升)