07 率的可信区间估算
陶立元 赵一鸣
记得之前听有人说,微信只能“微微地相信”,不能全信或笃信。我想我们在微信发布内容时则完全不是这个心态,我们是想让“微言有益”。也就是说,想通过短短的几百字把一件事说清楚,让这些事在日常科研工作中不会把我们给卡住。
比如今天的小事——率的可信区间的计算。多日前有一位医生找到我,说她通过某某方案将试管婴儿的成功率提高到某水平,但是自己在英文论文的投稿中遇到了问题,审稿人要求她提供这一率的可信区间。
可信区间?对于一个资深的临床医生而言,应该不是头一次听说。她也知道可信区间就是一个取值范围,表示在95%的可能下某一个参数可能的取值范围。但“官方”的说法应该是:可信区间(confidence interval,CI)是按一定的可信度,用样本统计量估计出的总体参数的所在范围。此处介绍几个概念:统计量是指从样本中计算出来的量,参数是指总体的量,可信度又称置信度(confidence level)就是某概率值,通常取95%或99%;统计描述就是对样本的统计量进行描述;统计推断就是用样本的统计量去推断总体参数。
换用普通的语言,可信区间就是在一定程度上某值的取值范围,如95%可信区间就是在95%的概率上某取值应该落在这一范围内。
说回刚才那位医生的问题,她的研究显示在986名采用某方案的IVF中,成功的有723例,占73.33%。那成功率的可信区间是多少呢?计算公式为(p-uα/2×sp,p+uα/2×sp)。式中,p为事件的发生率;uα/2为α置信度下的u值;sp为率的标准差,sp=。在上例中sp=1.41%,1.96×1.41%=2.76%。所以上面成功率的95%可信区间就为(70.57%,76.09%)。
但是上面的算法是有条件的,它是率的可信区间正态近似法的计算过程,正态近似法要求的条件是n较大且p不接近于0也不接近于1,具体的要求为n×p>5且n×(1-p)>5。也就是说发生率p不能接近0.001%或者99.999%,如果发生率接近这些值也可以,那么总例数n就应该很大。比如一个全国关于孕妇乙肝“大三阳”感染率的调查,样本量有300多万,这时候尽管孕妇的乙肝“大三阳”感染率不高,也可以采用正态近似法。但如果是孕妇的HIV感染率的调查,那真的很低,此时就需要考虑是否应该采用Poisson分布来估算。在正态近似法之外,还有查表法,它适用于样本总例数小于或等于50的情况,具体的表在绝大部分医学统计学教材上都有。
今天我们简单讨论了率的可信区间的估算,后面还有均数的可信区间以及可信区间与医学参考值范围的关系等问题,会陆续撰文讨论。其实如果要深入研究率的可信区间的估算,也没那么简单。如果对率的可信区间估算感兴趣,可以参考刘沛老师的以下几篇文章:“四种方法计算总体率可信区间的比较研究”“正态近似法计算二项分布总体率95%可信区间的应用条件研究”“总体率可信区间计算的一次近似法及其特征”。