购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

3.1.1 平均数

样本集中趋势的测量是位置(location)测量,通常用一个量数代表一个典型观测值。最常见的量数是样本平均数(mean, M )和样本中位数(median, Mdn M )。

平均数,又称算术平均数、均值或均数,是一组数据中各个数值总和除以数值的总个数得到的结果,计算公式为:

其中, 是求和符号, n 是样本量。譬如,有一组数据( n =10):10,12,15,18,20,22,17,15,17,19,其平均数 (10+12+…+19)=16.5。R计算平均数的函数是mean(x),其中x代表一个数值向量。平均数的优点是它在计算上包括所有的观测值,缺点是一个或几个异常值(outliers)可能会对平均数的大小产生实质性影响。异常值可能是极端大的值也可能是极端小的值一,。譬如,在上组数据中增加70和80,则平均数为 (10+12+…+80)=26.25。使用平均数的目的是代表一组数据中的典型值。本例中,除了70和80这两个异常值之外,其他所有的数值均小于26.25,因而平均数不再能够很好地代表典型值。

有时候平均数和中位数都可以用符号 M 表示。在容易产生混淆的地方,平均数用 表示,中位数用 Mdn 表示。 9CvRn9s+Vux3V5xYXz0lNFzDBedFIaLCbuuQzNoPD4CzQyXBYDHk6lJ+XNYeMJ8w

点击中间区域
呼出菜单
上一章
目录
下一章
×