1) 测量的概念
测量是指通过实验获得并可合理赋予某量一个或多个量值的过程。任何测量结果都含有误差,误差自始至终存在于一切科学实验和测量过程之中。测量方法是对测量过程中使用的操作所给出的逻辑性安排的一般性描述,可用不同方式表述,如替代测量法、微差测量法、零位测量法、直接测量法、间接测量法等。
2) 测量误差的概念
测量误差又称为误差,是指测得的量值减去参考量值。
常用的误差表示方法有3种:绝对误差、相对误差和引用误差。
(1) 绝对误差
绝对误差,即测量误差,是被测量的测得值与参考量值之差,即
Δ = x i -x 0 (2.1)
式中 Δ ——绝对误差;
x i ——测量结果或测得值;
x 0 ——被测量的参考量值。
(2) 相对误差
相对误差,即绝对误差除以被测量的参考量值,常用百分数或指数幂表示为
式中 r ——相对误差;
Δ ——绝对误差;
x 0 ——被测量的参考量值。
(3) 引用误差
引用误差,即测量仪器或测量系统的误差除以仪器的特定值,该特定值一般称为引用值,可以是测量仪器的量程或标称范围的上限。引用误差可用百分数表示为
式中 r n ——测量仪器或测量系统的引用误差;
Δ x ——测量仪器的绝对误差,常用示值误差表示;
x m ——测量仪器的量程或标称范围的上限。
仪器的准确度等级,就是根据它允许的最大引用误差来划分。0.1级,表示该仪器允许的最大引用误差上限为0.1%。以 r nm 表示为
式中 r nm ——最大引用误差;
Δ x m ——仪器量程或标称范围内出现的最大示值误差;
x m ——测量仪器的量程或标称范围的上限。
1) 测量误差的来源
测量误差的来源主要有人员误差、测量设备误差、被测对象变化误差、方法误差、环境误差等,对应简称为“人、机、料、法、环”5个方面。
(1) 人员误差
由测量人员的生理机能和实际操作,如视觉、听觉的限制或固有习惯、技术水平以及操作失误等所引起的误差。
(2) 测量设备误差
测量设备本身的结构、工艺、调整以及磨损、老化等所引起的误差。
(3) 被测对象变化误差
被测对象自身在整个测量过程中不断变化着,如被测量块的尺寸变化等所引起的误差。
(4) 方法误差
测量方法不完善,主要为测量技术及操作和数据处理所引起的误差。
(5) 环境误差
测量环境的各种因素,如温度、湿度、气压、含尘量、电场、磁场与振动等所引起的误差。
2) 测量误差的分类
按测量误差的性质或出现的规律,测量误差可分为系统测量误差和随机测量误差。
(1) 系统测量误差
系统测量误差简称系统误差,是指在重复测量中保持不变或按可预见方式变化的测量误差的分量,即
式中 γ i ——系统测量误差;
——对同一被测量进行无限多次测量所得结果的平均值;
x 0 ——被测量的真值。
系统测量误差的参考量值是真值,或是测量不确定度可忽略不计的测量标准的测得值,或是约定量值。系统测量误差及其来源可以是已知或未知的。对已知的系统测量误差可采用修正补偿。
(2) 随机测量误差
随机测量误差简称随机误差,是指在重复测量中按不可预见方式变化的测量误差的分量,即
式中 δ i ——随机测量误差;
x i ——测量结果;
——对同一被测量进行无限多次测量所得结果的平均值。
随机测量误差的参考量值是对同一被测量由无穷多次重复测量得到的平均值。一组重复测量的随机测量误差形成一种分布,该分布可用期望和方差描述,其期望通常可假设为零。
(3) 测量误差与系统测量误差 、 随机测量误差的关系
由式(2.5)可知:
由式(2.6)可知:
根据式(2.1)得
由此可知,测量误差等于系统误差和随机误差的代数和,即测量误差=系统测量误差+随机测量误差。
1) 随机误差
(1) 正态分布
①正态分布的特性
经统计分析,许多随机误差服从正态分布,它有以下3种特性:
a.对称性:绝对值相等的正负误差出现的可能性相等。
b.单峰性:绝对值小的误差出现的可能性大,绝对值大的误差出现的可能性小。
c.有界性:随机误差的绝对值不会超过某一界限。
②正态分布的图形表示
如图2.1所示,设数学期望为0。数学期望决定了图形的中心位置,标准偏差决定了图形中峰的陡峭程度。
③正态分布的随机误差表示法
a.密度函数
图2.1 正态分布
式中 e——自然对数的底(e≈2.71828);
x ——随机误差;
σ ——标准偏差;
σ 2 ——方差。
上述正态分布密度函数,又称高斯曲线。
b.数学期望
c.方差
d.标准偏差
式中 n ——测量次数;
x i ——第 i 次测得值;
——
n
次测得的算术平均值;
——第
i
次测得值与平均值之差,称为残余误差或残差,以
ν
i
记之。
由于 n 为有限次,所以上述标准偏差称为实验标准偏差,也称标准差或均方根差,对同一量( x )进行有限( n )次测量,其测得值( x i )间的分散性可用标准差 s ( x i )来表述。
可以导出,测量列平均值
的标准差
是单一测量值标准差
s
(
x
i
)的
倍,即
需要指出的是,
s
(
x
i
)是
n
次中单次测量的实验标准差,而
是测量列算术平均值的实验标准差。因随机误差具有抵偿性,故平均值的实验标准差比单次测量值的实验标准差小。
e.变异系数(相对标准偏差)
变异系数CV(Coefficient of Variation)又称为离散系数或相对标准偏差,是概率分布离散程度的一个归一化度量,是标准偏差与测量列平均值
的比值的百分比,即
比起标准差来,变异系数的优势是不需要参照数据的平均值。变异系数是一个无量纲量,在比较两组量纲不同或均值不同的数据时,应该用变异系数而不是标准差来作为比较的参考。但当平均值为零的时候,变异系数没有意义,变异系数一般适用于平均值大于零的情况。
(2) 非正态分布的随机误差表示方法
①均匀分布(矩形分布)(见图2.2)
a.密度函数
b.数学期望
c.方差
d.标准偏差
(
a
为被测量可能值包含概率区间的半宽度)
②三角分布(见图2.3)
图2.2 均匀分布
图2.3 三角分布
a.密度函数
b.数学期望
c.标准偏差
③梯形分布(见图2.4)
a.密度函数
b.数学期望
μ ( x ) = 0
c.标准偏差
④反正弦分布(见图2.5)
a.密度函数
b数学期望
μ ( x ) = 0
c.标准差
⑤t分布(见图2.6)
a.标准偏差
式中 t p ——包含概率;
ν ——自由度。
b.t分布是一般形式,而标准正态分布 N (0,1)是其特殊形式, t ( ν )成为标准分布的条件是当自由度 ν 趋于∞。
图2.4 梯形分布
图2.5 反正弦分布
图2.6 t 分布
(3) 统计分析中的常用术语及图示
下面介绍统计分析中的几种常用术语的概念(以标准正态分布为例)。
①置信区间
置信区间也称包含期间,是一个给定的数据区间,通常用标准差 σ 的 k 倍来表示,即[ A kσ , A + kσ ]。
②置信因子
置信因子也称包含因子,是置信区间[ A - kσ , A + kσ ]的标准差前面的放大系数。
③置信概率
置信概率也称置信度或置信水平,就是数据在置信区间的概率,用 p 表示,其表明了区间估计的可靠性,可在置信区间内对概率密度函数的定积分求得。
④显著性水平
估计总体参数落在某一区间内,可能犯错误的概率为显著性水平,用 a 表示。1- a = p , p 为置信度或置信水平。
如图2.7所示清晰表明了上述几个概念的关系。可见,在同一分布下,置信区间越宽,置信概率就越大,反之亦然。在不同的分布下,当置信区间给定时,标准差越小,置信因子和相应的置信概率就越大,反映出测量数据的可信度越高;当置信概率给定时,标准差越小,置信区间越窄,测量数据的可靠度就越高。
图2.7 统计分布术语图解
2) 系统误差
(1) 主要特征
由系统误差的定义和系统误差产生原因的分析,可以得出系统误差的主要特征为系统误差产生在测量之前,具有确定性;多次测量不能减弱和消除它,不具有抵偿性。
(2) 系统误差的减弱和消除
要减弱或消除系统误差,首先应发现系统误差。发现系统误差常用的方法有实验对比法、残余误差观察法、残余误差校验法、计算数据比较法、秩和检验法、t检验法等。
①采用加修正值的方法消除系统误差
因为 Δ = x i - x 0 ,所示 x 0 = x i +(- Δ )。
所谓修正值就是负的绝对误差,它是用代数法与未修正测量结果相加,以补偿系统误差的值。
②恒定系统误差的减弱和消除方法
a.交换消除法。
b.替代消除法。
c.异号抵消法。
③变值系统误差的减弱和消除方法
a.线性系统误差消除法——对称测量法。
b.周期性系统误差消除法——半周期偶数测量法。
3) 测量误差小结
如图2.8所示为有关测量误差的示意图。由图2.8可知,任意一个误差
Δ
均可分解为系统误差
γ
i
和随机误差
δ
i
的代数和。图中横坐标表示被测量,
x
0
为被测量的真值,
x
i
为第
i
次测得值,样本均值
就是
n
个测量值的算术平均值
,而总体均值
μ
就是当测量次数
n
→∞时统计平均值,或称为数学期望,即
。设测得值是正态分布
N
(
μ
,
σ
),则曲线的形状(按
σ
值)决定了随机误差的分布范围[
μ
-
kσ
,
μ
+
kσ
]及其在范围内取值概率,由图2.8可知,误差和它的概率分布密度相关,可以用概率论和数理统计的方法来恰当处理。图2.8清楚地表示了测得值
x
i
、被测量的真值
x
0
、平均值
、样本总体均值
μ
、系统误差
γ
i
、随机误差
δ
i
、残差
ν
i
之间的相互关系。
图2.8 测量误差示意图