1.3 测量误差与数据处理
1.3.1 测量误差的概念和分类
1. 有关测量技术中的部分名词
①等精度测量,在同一条件下所进行的一系列重复测量称为等精度测量。
②非等精度测量,在多次测量中,如对测量结果精确度有影响的一切条件不能完全维持不变的测量称为非等精度测量。
③真值,被测量本身所具有的真正值称为真值。真值是一个理想的概念,一般是不知道的,但在某些特定情况下,真值又是可知的,如一个整圆圆周角为360°等。
④实际值,误差理论指出,在排除系统误差的前提下,对于精密测量,当测量次数无限多时,测量结果的算术平均值极接近于真值,因而可将它视为被测量的真值。但是测量次数是有限的,故按有限测量次数得到的算术平均值,只是统计平均值的近似值,而且由于系统误差不可能完全被排除,因此通常只能把精度更高一级的标准器具所测得的值作为真值。为了强调它并非是真正的真值,故把它称为实际值。
⑤标称值,测量器具上所标出来的数值。
⑥示值,由测量器具读数装置所指示出来的被测量的数值。
⑦测量误差,用测量器具进行测量时,所测量出来的数值与被测量的实际值(或真值)之间的差值。
2. 误差的分类
按照误差出现的规律,可把误差分为系统误差、随机误差(也称为偶然误差)和粗大误差3类。
(1)系统误差
在同一条件下,多次测量同一量值时绝对值和符号保持不变,或在条件改变时按一定规律变化的误差称为系统误差,简称系差。
引起系统误差的主要因素有:材料、零部件及工艺的缺陷,标准量值、仪器刻度的不准确,环境温度、压力的变化,其他外界干扰。
(2)随机误差
在同一测量条件下,多次测量同一量值时,绝对值和符号以不可预定的方式变化的误差称为随机误差。
随机误差是由很多复杂因素的微小变化的总和引起的,如仪表中传动部件的间隙和摩擦、连接件的弹性变形、电子元器件的老化等。随机误差具有随机变量的一切特点,在一定条件下服从统计规律,可以用统计规律描述,从理论上估计对测量结果的影响。
(3)粗大误差
超出规定条件下预期的误差称为粗大误差,简称粗差,或称寄生误差。
粗大误差值明显歪曲测量结果。在测量或数据处理中,如果发现某次测量结果所对应的误差特别大或特别小时,应判断是否属于粗大误差,如属粗差,此值应舍去不用。
1.3.2 精度
反映测量结果与真值接近程度的量,称为精度。精度可分为:
①准确度,反映测量结果中系统误差的影响程度;
②精密度,反映测量结果中随机误差的影响程度;
③精确度,反映测量结果中系统误差和随机误差综合的影响程度,其定量特征可用测量的不确定度(或极限误差)表示。
对于具体的测量,精密度高的准确度不一定高,准确度高的精密度不一定高,但精确度高,则精密度和准确度都高。
1.3.3 测量误差的表示方法
测量误差的表示方法有以下几种。
1. 绝对误差
绝对误差是示值与被测量真值之间的差值。设被测量的真值为A0,器具的标称值或示值为x,则绝对误差为
由于一般无法求得真值A0,在实际应用时,常用精度高一级的标准器具的示值,即实际值A代替真值A0。x与A之差称为测量器具的示值误差,记为
通常以此值代表绝对误差。
在实际工作中,经常使用修正值。为了消除系统误差用代数法加到测量结果上的值称为修正值,常用C表示。将测得示值加上修正值后可得到真值的近似值,即
由此得
在实际工作中,可以用实际值A近似真值A0,则式(1.3.4)变为
修正值与误差值大小相等、符号相反,测得值加修正值可以消除该误差的影响,但必须注意,一般情况下难以得到真值,而用实际值A近似真值A0,因此,修正值本身也有误差,修正后只能得到较测量值更为准确的结果。
修正值给出的方式不一定是具体的数值,也可以是曲线、公式或数表。
2. 相对误差
相对误差是绝对误差Δx 与被测量的约定值之比。相对误差有以下几种表现形式。
(1)实际相对误差
实际相对误差γA是用绝对误差Δx 与被测量的实际值A的百分比表示的相对误差。记为
(2)示值相对误差
示值相对误差 γx是用绝对误差 Δx 与被测量的示值x的百分比表示的相对误差。记为
(3)满度(引用)相对误差
相对误差可用以说明测量的准确度,但不能评价指示仪表的准确度。对一个指示仪表的某一量限来说,标尺上各点的绝对误差相近,指针指在不同刻度上读数不同,所以各指示值的示值相对误差差异很大,无法用示值相对误差评价该仪表。为了划分指示仪表的准确度级别,选择仪表的测量上限,即满度值作为基准,由满度相对误差评价指示仪表的准确度。
满度相对误差 γn又称满度误差或引用误差,是用绝对误差 Δx 与器具的满度值xn 的百分比值表示的相对误差。记为
由于仪表各指示值的绝对误差大小不等,其值有正有负,因此,国家标准规定仪表的准确度等级a是用最大允许误差确定的。指示仪表的最大满度误差不准超过该仪表准确度等级的百分数,即
式中,γnm为仪表的最大满度误差(最大引用误差);Δxm为仪表示值中的最大绝对误差的绝对值;xn为仪表的测量上限;a为准确度的等级指数。式(1.3.9)是判别指示仪表是否超差,以及应属于哪个准确度级别的主要依据。
从使用仪表的角度出发,只有仪表示值恰好为仪表上限时,测量结果的准确度才等于该仪表准确度等级的百分数。在其他示值时,测量结果的准确度均低于仪表准确度等级的百分数,因为
当示值为x时,可能产生的最大相对误差为
式(1.3.11)表明,用仪表测量示值为x的被测量时,比值xn/x越大,测量结果的相对误差越大。由此可见,选用仪表时要考虑被测量的大小越接近仪表上限越好。为了充分利用仪表的准确度,选用仪表前要对被测量有所了解,其被测量的值应大于其测量上限的2/3。
1.3.4 随机误差
1. 正态分布
随机误差是以不可预定的方式变化着的误差,但在一定条件下服从统计规律,可以用统计规律描述。对随机误差做概率统计处理,是在完全排除系统误差的前提下进行的。在实际工作中,随机误差大部分是按正态分布的,其正态分布的概率密度f(δ)曲线如图1.3.1所示,其数学表达式为
图1.3.1 正态分布概率密度曲线
式中,y为概率密度,δ为随机误差,σ为标准差(均方根误差),e为自然对数的底。
其分布函数 F(δ)为
数学期望为
方差为
分析图1.3.1所示的曲线,可以发现正态分布的随机误差分布规律具有以下特点:
①对称性,绝对值相等的正误差和负误差出现的次数相等;
②单峰性,绝对值小的误差比绝对值大的误差出现的次数多;
③有界性,在一定的测量条件下,随机误差的绝对值不会超过一定界限;
④抵偿性,随着测量次数的增加,随机误差的算术平均值趋于零。
2. 随机误差的评价指标
由于随机误差大部分是按正态分布规律出现的,具有统计意义,故通常以正态分布曲线的两个参数算术平均值 —x和均方根误差 σ 作为评价指标。
(1)算术平均值 —x
对某一量进行一系列等精度测量,由于存在随机误差,其测量值皆不相同,应以全部测得值的算术平均值作为最后测量结果。
设对某一量做一系列等精度测量,得到一系列不同的测量值x1,x2,…,xn,这些测量值的算术平均值 —x定义为
并设各测量值与真值的随机误差为 δ1,δ2,…,δn,则
δ1 =x1 -A0,δ2 =x2 -A0,…,δn =xn -A0
即
由随机误差的对称性规律可以推出,当n→∞ 时,有
所以
即
式(1.3.17)表明,当测量次数为无限次时,所有测量值的算术平均值即等于真值,事实上不可能达到无限次测量,即真值难以达到。但是,随着测量次数的增加,算术平均值也就越接近真值。因此,以算术平均值作为真值是既可靠又合理的。
(2)标准差σ
① 测量列中单次测量的标准差。由于随机误差的存在,等精度测量列中各个测量值一般不相同,它们围绕着该测量列的算术平均值有一定的分散,此分散度说明了测量列中单次测量值的不可靠性,必须用一个数值作为其不可靠性的评定标准。
由式(1.3.12)可知,正态分布的概率密度函数是一个指数方程式,它是随着随机误差δ和标准差 σ 的变化而变化的。图1.3.2表示标准差和正态分布曲线的关系。从图中可以明显地看出 σ 与表示的分布曲线的形状和分散度有关。σ值越小,曲线形状越陡,随机误差的分布越集中,测量精密度越高;反之,σ值越大,曲线形状越平坦,随机误差分布越分散,测量精密度越低。因此,单次测量的标准差σ是表征同一被测量的n次测量的测量值分散性的参数,可作为测量列中单次测量不可靠性的评定标准。
图1.3.2 3种不同σ值的正态分布曲线
在等精度测量列中,单次测量的标准差可按下式计算
式中,n为测量次数;δi 为每次测量中相应各测量值的随机误差,且
δi =xi -A0
式中,xi 为各测得值;A0为被测量真值。
在实际工作中,一般情况下,被测量的真值为未知,这时可用被测量的算术平均值代替被测量的真值进行计算,则有
vi =xi -x-
式中,xi为第i个测量值;为测量列的算术平均值;vi为xi的残余误差(简称残差),即用残差来近似代替随机误差求标准差的估计值,则式(1.3.18)变为
式(1.3.19)称为贝塞尔(Bessel)公式,根据此式可由残余误差求得单次测量列标准差的估计值。
② 测量列算术平均值的标准差。在多次测量的测量列中,通常以算术平均值作为测量结果,因此,必须研究算术平均值不可靠的评定标准。而算术平均值的标准差σ—x 可作为算术平均值不可靠性的评定标准
式中,σ—x 为算术平均值标准差(均方根误差);σ 为测量列中单次测量的标准差;n为测量次数。
由式(1.3.20)可知,在n次等精度测量中,算术平均值的标准差为单次测量的,当测量次数n越大时,算术平均值越接近被测量的真值,测量精度也越高。
3. 测量的极限误差
测量的极限误差是极端误差,检测量结果的误差不超过该极端误差的概率P,并使出现超过的概率为1 -P,误差超过该极端误差的检测量的测量结果可以忽略。
(1)单次测量的极限误差
测量列的测量次数足够多和单次测量误差为正态分布时,随机误差正态分布曲线下的全部面积相当于全部误差出现的概率,即
而随机误差在 -δ至δ范围内的概率为
引入新的变量t
经变换,式(1.3.22)变为
函数Φ(t)称为概率积分。
若某随机误差在 ± t σ范围内出现的概率为2Φ(t),则超出该误差范围的概率为
α =1 - 2Φ(t)
表1.3.1给出了几个典型的 t值及其相应的超出或不超出| δ| 的概率(见图1.3.3)。
表1.3.1 几个典型t值的概率情况分析
由表1.3.1可见,随着t的增大,超出| δ| 的概率减小得很快。当t=2,即| δ| = 2σ时,误差不超出| δ| 的概率为95.44%。当t =3时,即| δ| = 3σ 时,误差不超过| δ| 的概率为99.73%,通常把这个误差称为单次测量的极限误差δ limx,即
图1.3.3 单次测量极限误差
(2)算术平均值的极限误差
测量列的算术平均值与被测量的真值之差称为算术平均值误差δ—x,即
当多个测量列算术平均值误差δ—x(i=1,2,…,n)为正态分布时,根据概率论知识,同样得到测量列算术平均值的极限误差表达式为
式中,t为置信系数;σ—x 为算术平均值的标准差。
通常取t =3,则
1.3.5 系统误差
1. 系统误差的发现
(1)理论分析及计算
因测量原理或使用方法不当引入系统误差时,可以通过理论分析和计算的方法加以修正。
(2)实验对比法
实验对比法是改变产生系统误差的条件进行不同条件的测量,以发现系统误差,这种方法适用于发现恒定的系统误差。在实际工作中,生产现场使用的量块等计量器具需要定期送法定的计量部门进行检定,即可发现恒定系统误差,并给出校准后的修正值(数值、曲线、表格或公式等),利用修正值在相当程度上消除恒定系统误差的影响。
(3)残余误差观察法
残余误差观察法是根据测量列的各个残余误差的大小和符号变化规律,直接由误差数据或误差曲线图形判断有无系统误差,这种方法主要适用于发现有规律变化的系统误差。
(4)残余误差校核法
①用于发现累进性系统误差。当累进性系统误差不比随机误差大很多时,可用马利科夫(M.Ф.MAЛИКOB)准则进行判断。
马利科夫准则:设对某一被测量进行n次等精度测量,按测量先后顺序得到测量值x1,x2,…,xn,相应的残差为v1,v2,…,vn。把前面一半和后面一半数据的残差分别求和,然后取其差值
式中,当n为偶数时,取k = n / 2;当n为奇数时,取k =(n + 1)/2。
如果M近似为零,则说明测量列中不含累进性系统误差;如果M与vi相当或更大,则说明测量列中存在累进性系统误差。
② 用于发现周期性系统误差。如果随机误差很显著,误差周期性规律不易被发现,可用阿贝⁃赫尔默特(Abbe⁃Helmert)准则进行判断。
阿贝⁃赫尔默特准则:设
当存在
则认为测量列中含有周期性系统误差。
(5)计算数据比较法
若对同一量独立测得m组结果,并知它们的算术平均值和标准差为
而任意两组结果之差为
其标准差为
则任意两组结果与间不存在系统误差的标志是
2. 系统误差的削弱和消除
(1)从产生误差源上消除系统误差
从产生误差源上消除误差是最根本的方法,它要求在产品设计阶段从硬件和软件方面采取必要的补偿和修正措施,或者采取合适的使用方法将误差从产生根源上加以消除。
(2)引入修正值法
这种方法预先将被测量器具的系统误差检定或计算出来,做出误差表或误差曲线,然后取与误差数据大小相同而符号相反的值作为修正值,将实际测得值加上相应的修正值,即可得到不包含该系统误差的测量结果。
(3)零位式测量法
零位式测量法是标准量与被测量相比较的测量方法,其优点是测量误差主要取决于参加比较的标准器具的误差,而标准器具的误差可以做得很小。零位式测量要求检测系统有足够的灵敏度,在自动检测系统中广泛使用的自动平衡显示仪表就属零位式测量。
(4)补偿法
下面结合实例说明补偿法原理。图1.3.4为用补偿法测量高频小电容的电路原理图。图中,E为恒压源;L为电感线圈;Cs为标准可变电容;V为高内阻电压表。图中C′0是电感线圈自身分布电容,可以把它等效看做与电容Cs并联,这时为C0。测量时,先不接入待测电容Cx,调节标准电容,通过电压表来观察电路谐振点,此时标准电容读数为C s1;然后,把C x 接入A,B端,此时电路将失谐,调节标准电容,使电路仍处于谐振,此时标准电容读数为C s2。显然,两次谐振回路的电容应相等,即
图1.3.4 补偿法测量高频小电容
于是可得
由此可见,消除了恒定系统误差C0的影响。
(5)对照法
在一个检测系统中,改变一下测量安排,测出两个结果。将这两个测量结果互相对照,并通过适当的数据处理,可对测量结果进行改正,这种方法称为对照法,也称交换法。
下面以电桥为例说明如何消除系统误差,如图1.3.5所示,用一个比较电桥和一个可调标准电阻R3测量电阻Rx,设该电桥为等臂电桥,即R1/R2 =1。先按图1.3.5(a)安排,当电桥平衡时,有
图1.3.5 对照法消除系统误差
然后按图1.3.5(b)安排,设此时电桥不平衡,重新调节R3,使其值为R′3,使电桥又重新平衡,此时
将式(1.3.34)与式(1.3.35)相乘再开方,可得
由此可见,采用对照法可以消除R1与R2的系统误差,仅含有标准器具的误差。
1.3.6 粗大误差
判别粗大误差最常用的统计判别法是 3σ 准则:如果对某被测量进行多次重复等精度测量的测量数据为
x1,x2,…,xd,…,xn
其标准差为 σ,如果其中某一项残差vd大于3倍标准差,即
则认为vd是粗大误差,与其对应的测量数据xd是坏值,应从测量列测量数据中剔除。
需要指出的是,剔除坏值后,还要对剩下的测量数据重新计算算术平均值和标准差,再按式(1.3.36)判别是否还存在粗大误差,若存在粗大误差,剔除相应的坏值,再重新计算,直到产生粗大误差的坏值全部剔除为止。
1.3.7 测量不确定度
由于测量误差的存在,被测量的真值难以确定,测量结果带有不确定性。长期以来,人们不断追求以最佳方式估计被测量的值,以最科学的方法评估测量结果的质量高低。测量不确定度就是评定测量结果质量高低的一个重要指标。
1. 测量不确定度的定义与分类
(1)测量不确定度的定义
测量不确定度表示测量结果(测量值)不能肯定的程度,是可定量地用于表达被测量测量结果分散程度的参数。这个参数可以用标准偏差表示,也可以用标准偏差的倍数或置信区间的半宽度来表示。
(2)测量不确定度的分类
测量不确定度可以分为标准不确定度u、合成不确定度uc和扩展不确定度U或Up。
2. 测量不确定度与误差
测量不确定度和误差是误差理论中两个重要概念,它们具有相同点,都是评价测量结果质量高低的重要指标,都可以作为测量结果的精度评定参数,但它们又有明显的区别。
误差是测量结果与真值之差,它以真值或约定真值为中心。测量不确定度是以被测量的估计值为中心。因此误差是一个理想的概念,一般不能准确知道,难以定量;而测量不确定度是反映人们对测量认识不足的程度,是可以定量评定的。
在分类上,误差按自身特征和性质分为系统误差、随机误差和粗大误差,并可采取不同措施来减小或消除各类误差对测量的影响。但是由于各类误差之间并不存在绝对界限,故在分类判别和误差计算时不易准确掌握。测量不确定度不按误差性质分类,而是按评定方法分为A类评定和B类评定,按实际情况的可能性加以选用,从而简化了分类,便于评定与计算。
不确定度与误差既有区别,也有联系。误差是不确定度的基础,研究不确定度首先需要研究误差,只有对误差的性质、分布规律、互相联系及对测量结果的误差传递关系等有充分的认识和了解,才能更好地估计各不确定度分量,正确地得到测量结果的不确定度。用测量不确定度代替误差表示测量结果,易于理解,便于评定,具有合理性和实用性。
3. 标准不确定度的定义与评定
(1)标准不确定度u
以标准偏差表示的不确定度就称为标准不确定度,用符号u表示。测量结果通常由多个测量数据子样组成,对表示各个测量数据子样不确定度的偏差,称为标准不确定度分量,用ui表述。标准不确定度有A类和B类两类评定方法。
A类标准不确定度是指用统计方法得到的不确定度,用符号uA表示。
B类标准不确定度是指用非统计方法得到的不确定度,即根据资料或假定的概率分布的标准偏差表示的不确定度,用符号uB表示。
(2)A类标准不确定度的评定方法
A类标准不确定度的评定通常可以采用下述统计与计算方法。在同一条件下,对被测参量x进行n次等精度测量,测量值为xi(i=1,2,…,n)。该样本数据算术平均值,进而可以算出算术平均值标准偏差。
(3)B类标准不确定度的评定方法
B类标准不确定度评定方法是根据有关的信息来评定的,即通过一个假定的概率密度函数得到的。它通常不是利用直接测量获得数据,而是依次查证已有的信息获得,如仪器校准报告等。
B类标准不确定度的评定:
uB(xi)=U(xi)/k
式中,uB(xi)为xi分量B类标准不确定度;U(xi)为第xi分量技术文件给出的不确定度;k为技术文件给出的不确定度与标准偏差的倍数或指明的包含因子,其值与测量值xi 的统计分布有关,详见有关参考文献。
4. 合成标准不确定度的定义与评定
(1)合成标准不确定度定义
由各不确定分量合成的标准不确定度,称为合成标准不确定度。当间接测量时,即测量结果是由若干其他量求得的情况下,测量结果的标准不确定度等于其他各量的方差和协方差相应和的平方根,用符号uc表示。
(2)合成标准不确定度的评定方法
设测量模型方程为:y=f(x1 +x2 +…+xn)=f(xi),它是一个多变量函数。若每个自变量彼此独立,且互不相关,则
式(1.3.37)称为不确定度传播率。合成标准不确定度仍然是标准差,表示测量结果的分散性。
5. 扩展不确定度U或UP的定义与评定
(1)扩展不确定度U或Up的定义
扩展不确定度是确定测量区间的量,合理赋予被测量之值的分布,大部分可包含在此区间内。
(2)扩展不确定度U或Up的评定
① 采用乘以给定包含因子k的评定。在合成标准不确定度uc(y)确定以后,乘以一个包含因子k,即得扩展不确定度U为
式中,U为扩展不确定度;uc(y)为合成标准不确定度;k为包含因子,k =2 ~ 3。
② 乘以给定概率p的包含因子kp的评定。在合成标准不确定度uc(y)确定之后,乘以给定概率p的包含因子kp,即得扩展不确定度Up为
式中,Up是概率为p时的扩展不确定度,一般用U95或U99表示;kp为给定概率p的包含因子。
6. 测量结果与测量不确定度的表示
测量结果是由测量所得到的赋予被测量的值,测量结果仅是被测量的估计值。在等精度测量的情况下得到一组测量值,首先修正系统误差,然后计算出算术平均值,如果测量仪器的检定证书上提供了修正值b,则完整的测量结果应该为算术平均值经过修正后的值,即+b。
当给出完整的测量结果时,一般应报告其不确定度。报告应尽可能详细,以便使用者能正确地利用测量结果。测量不确定度的表示形式有合成标准不确定度uc(y),扩展不确定度U=kuc(y)或Up =kpuc(y)。因为涉及的内容较多,限于篇幅,在实际应用时可参阅有关文献。
1.3.8 数据处理的基本方法
所谓数据处理是从获得数据起到得出结论为止的整个数据加工过程。常用的数据处理方法有列表法、作图法和最小二乘法拟合,本节主要讨论最小二乘法线性拟合。
在科学实验和统计研究中,常常要从一组测量数据求得变量间的最佳函数关系,如从n对(xi,yi)的测量值去求得变量x和y间的最佳函数关系式y=f(x)。从图形上来看,这个问题就是在平面直角坐标上,从给定的n个点(xi,yi)(i =1,2,…,n)求一条最接近这一组数据点的曲线,以显示这些点的总趋向,这一过程称为曲线拟合,该曲线的方程称为回归方程。
所谓最小二乘法原理,是指测量结果的最可信赖值应在残余误差平方和为最小的条件下求出。在自动检测系统中,两个变量间的线性关系是一种最简单也是最理想的函数关系。
设有n组实测数据(xi,yi)(i =1,2,…,n),其最佳拟合方程(回归方程)为
式中,A为直线的截距,B为直线的斜率。令
根据最小二乘法原理,要使个方程,联立两个方程可求出A和B的唯一解。即为最小,取其对A和B的偏导数,并令其为零,可得两个方程,联立两个方程可求出A和B的唯一解。即
则得到下列正则方程组
解得