1)真值
真值是在某一时刻、某一状态下,某物理量客观存在的实际大小。一般来说,真值是人们需要通过观测求得的,是客观存在的,但不一定能精确得到,只能随着技术发展、认识深入不断逼近。
(1)理论真值
实际中,有些物理量的真值是已知的,如平面三角形三内角之和恒为 180 ° ;一个圆的圆心角为 360 ° ;某一物理量与本身之差为 0 或者比值为 1,这种真值称为理论真值。
(2)约定真值
因为真值无法获得,计算误差是必须找到真值的最佳估计值,即约定真值。约定值通常用最大的绝对误差Δ X 来估计其大小范围:
即在某一时刻和某一状态下,某量的客观值或实际值。真值一般是未知的,但从相对意义上来说,真值又是已知的,如国家标准样品的标称值、国际上公认的计量值等。
2)平均值
在科学实验中,真值是指在无系统误差的情况下,观测次数无限多时求得的平均值,但是实际测量总是有限的,经常将有限次测量实验所求得的平均值作为真值的近似逼近。
科学实验中,平均值又分为算数平均值、均方根平均值、几何平均值、对数平均值、调和平均值、加权平均值。
①算术平均值:最常用的一种平均值,当观测值呈正态分布时,算术平均值最近似真值。适用于等精度实验、实验值服从正态分布的场合。设 x 1 , x 2 ,…, x n 为各次的观测值, n 代表观测次数,则算术平均值为:
②均方根平均值:也称方均根或有效值。常用于计算分子的平均动能,一般应用较少。设 x 1 , x 2 ,…, x n 为各次的观测值, n 代表观测次数,则均方根平均值为:
③几何平均值:一组 n 个观测值连乘并开 n 次方求的值。如果一组观测值是非正态分布的,当对这组数据取对数后,所得分布曲线的图形对称时,常用几何平均值。设 x 1 , x 2 ,…, x n 为各次的观测值, n 代表观测次数,则几何平均值为:
④对数平均值:若一组测定值,取对数后遵从正态分布,则称其遵循对数正态分布,其平均值为对数平均值。适用于实验数据的分布曲线具有对数特性的场合。设有两个数值 x 1 , x 2 ,均为正数,则它们的对数平均值为:
⑤调和平均值:设 x 1 , x 2 ,…, x n 为各次的观测值, n 代表观测次数,则它们的调和平均值为:
⑥加权平均值:若对同一物理量用不同方法去测定,或者由不同的人去测定,计算平均值时,常对比较可靠的数值予以加重平均,称为加权平均。设 x 1 , x 2 ,…, x n 为各次的观测值, ω 1 , ω 2 ,…, ω n 为各观测值相应的权数, n 代表观测次数,则加权平均值为:
权数确定:
•观测值的重复次数。
•实验次数很多时,以实验值 x i 在测量中出现的频率 n i / n 作为权数。
•根据权与绝对误差的平方成反比来确定权数。
•根据权与方差的平方成反比来确定权数。
不考虑测量值的大小时,调和平均值≤几何平均值≤算术平均值≤均方根平均值;如果 a > b >0 时,且 a ≠ b ,存在着 a >算数平均值>对数平均值>几何平均值>调和平均值> b 的关系,即
【例3.1】 在实验室称量某样品时,不同的人得到 4 组称量结果,见表 3.3,如果认为各测量结果的可靠程度仅与测量次数成正比,试求其加权平均值。
表3.3 例 3.1 的测量值与平均数和权数
解 :由于测量结果的可靠程度仅与测量次数成正比,每组实验平均值的权值即为对应的实验次数,所以加权平均值为:
【例3.2】 在测定溶液pH值时,得到 2 组实验数据,其平均值分别为 x 1 = 8.5±0.1; x 2 =8.53±0.02;求平均值。
解 :根据两组数据的绝对误差计算权重(权值与绝对误差的平方成反比):
1)绝对误差
某物理量与其真值之差称为绝对误差,是测量值偏离真值大小的反映。即
2)相对误差
绝对误差与真值的比值所表示的误差称为相对误差,有时,也表示为绝对误差与测量值的比值。采用相对误差更能清楚地表示出测量的准确程度。
当绝对误差很小时,测量值/绝对误差≫1,此时,
3)引用误差
相对误差还有一种简便实用的形式,即引用误差。为了减少误差计算中的麻烦和划分仪器正确度等级的方便,一律取仪表的量程或测量范围上限值作为误差计算的分母(即基准值),而分子取仪表量程范围内可能出现的最大绝对误差值。
在热工仪表中,正确度等级一般都是用引用误差来表示的,通常分成 0.1,0.2,0.5,1.0,1.5,2.5 和 5.0 七个等级。上述数值表示该仪器最大引用误差的大小,但不能认为仪表在各个刻度上的测量都是如此大的误差。例如,某仪表正确度等级为 R (即引用误差为 R% ),满量程的刻度值为 X ,实际使用时的测量值为 x (一般 x ≤ X ),则
通过上面的分析,为了减少仪表测量的误差,提高正确度,应该使仪表尽可能地在靠近满量程刻度的区域内使用,这正是人们利用或选用仪表时,尽可能地在满刻度量程的 2 /3 以上区域使用的原因。
一个量的观测值或计算值与其真实值之差特指统计误差,即一个量在测量、计算或观察过程中由于某些错误或通常由于某些不可控制因素的影响而造成的变化偏离标准值或规定值的数量。误差是不可避免的。误差的来源,主要有下述 4 个方面。
①设备仪表误差:包括所使用的仪器、器件、引线、传感器及提供检定用的标准器等,均可引入误差。
②环境误差:周围环境的温度、湿度、压力、振动及各种可能干扰测量的因素,均能使测量值发生变化,使测量失准,产生误差。
③人员误差:测量人员分辨能力、测量经验和习惯,影响测量误差的大小。
④方法误差:研究与实验方法引起的误差。如实验设计不合理、经验公式形式的选择不当及运算过程中过多的舍入而累积的误差等,都会使最终结果的误差变大。
此外,测量过程中,被测对象本身的随机而微小的变化,一般也按误差考虑。
为了研究误差的特点,按照误差产生的原因和性质,可将误差分为 3 类:随机误差、系统误差、过失误差(粗大误差)。
1)随机误差
在实际相同条件下,对同一被测量进行多次等精度测量时,由于各种随机因素(如温度、湿度、电源电压波动、磁场等)的影响,各次测量值之间存在一定差异,这种差异就是随机误差。测量时,每一次测量的误差均不相同,时大时小,时正时负,不可预定,无确定规律。随机误差产生于众多因素的微小波动,这些影响既难发现又难排除,是伴随整个测量过程不能消除的误差。随机误差具有随机变量的一切特征,所以,必须采用数理统计的方法来研究随机误差的统计特征,以判断它对测量结果的影响。
例如,对某一个实际测量的结果进行统计分析(表 3.4),可以发现随机误差的特点和规律。
表3.4 测量值分布表
表 3.4 中观测总次数 150 次,某测量的算数平均值为 5.02,共分 14 个区间,每个区间间隔0.01,为直观起见,把表中的数据画成频率分布的直方图(图 3.1)从图中可以分析归纳随机误差的特点。
①单峰性:误差绝对值小的,密度最大,误差绝对值大的,密度最小,表 3.4 中, ≤0 .03 的次数为 110 次, ≤0.01 其中的占 61 次,而 >0.03 的仅 40 次。可见随机误差的分布呈单峰形。
②对称性:绝对值相等的误差,出现的概率相等。
③抵偿性:在相同条件下对同一量进行测量,当测量次数很大时,误差的总和应为零。由于绝对值相等的正负误差出现的次数相等,误差正负相抵;全部误差的算术平均值随着测量次数的增加趋近于零,即随机误差具有抵偿性。抵偿性是随机误差最本质的统计特性。
④有界性:当测量条件一定时,误差的绝对值实际上不会超出某一界限,表 3.4 中的Δ x i 不大于 0.07,绝对值很大的误差出现的概率接近于零。
随机误差表示测量结果偏离其真实值的分散情况。一般分布形式接近于正态分布。
消除方法可采用在同一条件下,对被测量进行足够多次重复测量,取其算术平均值作为测量结果的方法。
图 3.1 频率分布直方图
2)系统误差
系统误差是由于偏离测量规定的条件,或者测量方法不合适,按某一确定规律引起的误差,即分析过程中某些确定的、经常性的因素引起的误差。当测量条件一定时,误差的大小和方向恒定,当测量条件变化时,误差按某一确定规律变化,这种误差称为系统误差。所谓确定规律,是指误差变化可用函数式或用曲线图形描述。系统误差的产生一般是由一个或几个因素引起的,因而是有规律的。系统误差存在以下 4 种情况,如图 3.2 所示。
图 3.2 系统误差
①如图 3.2(a)所示,无系统误差,测量正确度高。
②如图 3.2(b)所示,存在恒定系统误差,误差大小和方向不变。
③如图 3.2(c)所示,线性系统误差,存在累进(减)系统误差,随测量时间的增加,误差基本呈线性变化。
④如图 3.2(d)所示,存在周期性系统误差,误差大小和符号有规律地周期变化。
对于确知存在而又无法消除的系统误差,需要正确地进行数据处理:
①恒定系统误差,方向和大小均已确定不变,应采用对测量值修正的办法消除。
②变化系统误差,先估计在测量过程中的变化区间:[ a , b ], a < b ,( a + b ) /2 作为恒定系统误差加以修正,取区间的半宽度( a + b ) /2 = e 作为随机误差的误差限。
系统误差的特点:
①重现性即重复测定重复出现。
②单向性即误差或大、或小、或正、或负。
③可测性即误差恒定,可以校正。
系统误差存在与否决定分析结果的准确度。一般来说,系统误差存在的原因如下:
①方法误差,由分析方法自身不足所造成的误差。如在重量分析法中,沉淀的溶解度大,沉淀不完全引起的分析结果偏低。
②仪器误差,由测量仪器自身的不足所引起的误差。如容量仪器体积不准确;分光光度计的波长不准确。
③原理误差。
系统误差有其对应的规律性,它不能依靠增加测量次数来加以消除,一般可通过试验分析方法掌握其变化规律,并按照相应规律采取补偿或修正的方法加以消减。
减小系统误差的方法有:
①对所使用的仪器按期严格检定,在规定的使用条件下,按操作规程正确使用,对测量仪表进行校正,在准确度要求较高的测量结果中,引入校正值进行修正。
②消除产生误差的根源,即正确选择测量方法和测量仪器,尽量使测量仪表在规定的使用条件下工作,消除各种外界因素造成的影响。
3)过失误差
测量误差明显地超出正常值的误差为过失误差,又称粗大误差。这通常是由于测量人员疏忽,造成读数、记录或运算错误,或测试条件突然变化而发生测量值显著异常的结果。确切地说:在相同条件下,对同一被测量进行多次等精度测量时,有个别测量结果的误差远远大于规定条件下的预计值。这类误差一般由于测量者粗心大意或测量仪器突然出现故障等造成,也称为粗大误差。所谓“过失误差”,其实已经不属于误差之列;所以,对于含有过失误差的值又称为坏值,在对实验结果进行数据处理之前,需先行剔除坏值。