拟合优度检验用于分析样本与假设分布间的拟合程度,不同的拟合优度检验方法(简称优检方法)的效力也不相同,本节引入以下几种适用性较好的优检方法。
1.灰色关联度分析法
灰色关联度分析法是通过因素的时间序列曲线发展态势的相似程度来计算关联度的。与其他优检方法相比,该方法有如下优点:不依赖大样本数据;不需要数据有典型分布;是数据间发展态势的比较,检验效果较好。
具体过程如下:
对于时间区间[ a , b ], b > a ≥0,令Δ t k = t k -t k -1 ,Δ t k >0( k =2,3,…, n );[ a , b ]=∪Δ t k ,Δ t k ∩Δ t k -1 =∅( k =3,4,…, n )。则两序列在[ a , b ]各点上的取值为
式中, X 1 、 X 2 是相同指标在各点的值。
(1)标准化:
(2)计算增量序列:
(3)计算各时段关联系数:
结合T型关联度,引入符号函数sgn( · ),表示 X 1 、 X 2 间的正负相关性,即
式中, 。
(4)计算两序列间的关联度 r ( X 1 , X 2 ):
r ( X 1 , X 2 )的值越大,表明两序列间的变化态势越相似,即对应的该分布函数拟合程度越好。
2.误差面积比指数法
假设有两种分布曲线关系如图1-8所示,用 表示拟合分布函数 , Y 表示样本经验分布函数 F ( t ),则有:
式中, e ( t )为偏差函数。
图1-8 两种分布曲线关系
当接受原有的统计假设检验时, e ( t )就有了明确的界限。 e ( t )与横轴所围成的面积 S e 越小, 与 Y 之间的偏差就越小,那么就可以用 近似代替 F ( t )。 S e 的计算公式为
式中, n 为分割区间的个数。
又令 S 表示 与横轴围成的面积, S 的计算公式为
考虑到 S e 的属性,将面积比 S e /S 作为拟合优度的判据,故误差面积比指数 R 的最终计算公式为
从推导过程可知, R 的值越小,分布函数拟合程度越好。这种方法不仅从整体上考虑了拟合误差,还兼顾了各数据点上的相对误差。
3.方根误差分析法
一组数据中的特大或特小误差可以由方根误差灵敏地反映出来,因此,均方根误差(RMSE)和相对均方根误差(NRMSE)常用来定量评价不同方法对同一组数据的拟合精度。RMSE、NRMSE分别定义如下:
式中, F n ( t i )为经验分布函数; F ( t i )为拟合分布函数; n 为数据个数。
由式(1-67)和式(1-68)可知,模型拟合程度越好,RMSE和NRMSE的值越小。