中位数绝对离差是稳健的尺度测量,在异常值诊断中发挥着重要作用。中位数绝对离差计算上为样本量为 n 的样本中每个值与中位数差异绝对值的中位数:
譬如,有一组数据( n =11):20,23,25,30,23,36,33,30,40,80,28,它的中位数 Mdn =30,各个数值减去中位数后的绝对值是:10,7,5,0,7,6,3,0,10,50,2。将该组数据按升序排列,得到:0,0,2,3,5,6,7,7,10,10,50。中位数绝对离差是这些排序后的数值的中位数,即 MAD =6。
根据Wilcox(2017b,p.78),如果观测值从正态分布的总体中随机抽样得到, MAD 不是对 σ 的估计,而是估计 ,其中 是标准正态分布概率0.75对应的分位数(约为0.674 5)。 MAD 通常被调整尺度,以便在正态分布情况下估计 σ ,即:
其中, MADN 表示正态化的 MAD 。上例中 MAD =6,则 MADN ≈8.90。R计算 MADN 的函数是mad(x),其中x是数值向量。