极差

极差

最大值减最小值后所得之的数据
极差又称范围误差或全距(Range),以R表示,是用来表示统计资料中的变异量数(measures of variation),其最大值与最小值之间的差距,即最大值减最小值后所得之数据。它是标志值变动的最大范围,它是测定标志变动的最简单的指标。移动极差(Moving Range)是其中的一种。极差不能用作比较,单位不同 ,方差能用作比较, 因为都是个比率。
    中文名:极差 外文名:range 别名:全距 适用领域范围:适用样本容量较小(n<10)情况 属性:用来表示统计资料中的变异量数 符号:R 应用学科:数学统计学

定义

极差是指总体各单位的标志值中,最大标志值与最小标志值之差。它是标志值变动的最大范围。极差也称为全距或范围误差,它是测定标志变动的最简单的指标。换句话说,也就是指一组数据中的最大数据与最小数据的差叫做这组数据的极差。极差英文为range,简写为R,表示为:R=Xmax-Xmin。移动极差(Moving Range)是其中的一种。

计算公式

全距=最大标志值—最小标志值

R=Xmax-Xmin

(其中,Xmax为最大值,Xmin为最小值)

例如:12、12、13、14、16、21

这组数的极差就是:21-12=9

例如,“早穿皮袄午穿纱”,这句话说明的气温特征数就是极差。

方差计算公式:s^2=(1/n)*[(x1-x0)^2(x2-x0)^2+...+(xn-x0)^2]

(X0即为x的平均值)

移动极差

移动极差(Moving Range),是指两个或多个连续样本值中最大值与最小值之差,这种差是按这样方式计算的:每当得到一个额外的数据点时,就在样本中加上这个新的点,同时删除其中时间上“最老的”点,然后计算与这点有关的极差,因此每个极差的计算至少与前一个极差的计算共用一个点的值。一般说来,移动极差用于单值控制图,并且通常用两点(连续的点)来计算移动极差。

极差计算示例

求下列数字集的极差

65、81、73、85、94、79、67、83、82

极差指的是这些数字分开得有多远,计算方法是:用其中最大的数减去最小的数

首先找其中最大的数,65、81、73、85、94、79、67、83、82

最大数是94,94比其他数都大,所以它是这些数字中最大的。然后要减去这些数字中最小的。该数字集中最小的数字是65。

那么极差是:

94−65

算一算

94−65=29

这个数字越大,表示分得越开,最大数和最小数之间的差就越大,该数越小,数字键就越紧密,这就是极差的概念!

用途和意义

在统计中常用极差来刻画一组数据的离散程度,以及反映的是变量分布的变异范围和离散幅度,在总体中任何两个单位的标准值之差都不能超过极差。同时,它能体现一组数据波动的范围。极差越大,离散程度越大,反之,离散程度越小。

极差只指明了测定值的最大离散范围,而未能利用全部测量值的信息,不能细致地反映测量值彼此相符合的程度,极差是总体标准偏差的有偏估计值,当乘以校正系数之后,可以作为总体标准偏差的无偏估计值,它的优点是计算简单,含义直观,运用方便,故在数据统计处理中仍有着相当广泛的应用。但是,它仅仅取决于两个极端值的水平,不能反映其间的变量分布情况,同时易受极端值的影响。

极差

最直接也是最简单的方法,即最大值-最小值(也就是极差)来评价一组数据的离散度。这一方法在日常生活中最为常见,比如比赛中去掉最高最低分就是极差的具体应用。

2.离均差的平方和

由于误差的不可控性,因此只由两个数据来评判一组数据是不科学的。所以人们在要求更高的领域不使用极差来评判。其实,离散度就是数据偏离平均值的程度。因此将数据与均值之差(我们叫它离均差)加起来就能反映出一个准确的离散程度。和越大离散度也就越大。

但是由于偶然误差是成正态分布的,离均差有正有负,对于大样本离均差的代数和为零的。为了避免正负问题,在数学有上有两种方法:一种是取绝对值,也就是常说的离均差绝对值之和。而为了避免符号问题,数学上最常用的是另一种方法--平方,这样就都成了非负数。因此,离均差的平方和成了评价离散度一个指标。

3.方差(S2)

由于离均差的平方和与样本个数有关,只能反应相同样本的离散度,而实际工作中做比较很难做到相同的样本,因此为了消除样本个数的影响,增加可比性,将离均差的平方和求平均值,这就是我们所说的方差成了评价离散度的较好指标。

我们知道,样本量越大越能反映真实的情况,而算数均值却完全忽略了这个问题,对此统计学上早有考虑,在统计学中样本的均差多是除以自由度(n-1),它是意思是样本能自由选择的程度。当选到只剩一个时,它不可能再有自由了,所以自由度是n-1。

①离散程度的通俗解释——波动大小,

②为什么要研究一组数据的离散程度。

全面认识一组数据的两个特征:

探索平均数的代表性。

实际问题的需要。

③探索如何表示一组数据的离散程度——方差的形

成过程。

首先,极差——比较粗略;

其次,平均差,比极差更全面,不常用;

再次,选择方差,但数值的单位与原数据单位不

一致。

最后,常用标准差。δ=S2

④统计含义的解释——方差全面地平均地反映,

标准差全面地直接地反映。

偏离平均数——指与平均数的离差。

平均的——指离差的平均数的平均值。

全面的——指考虑了每个数据的离差。

直接的——指数值单位与原数据单位一致。

⑤应用条件——平均数相同。特殊情况,平均数相

差很小、近似相等时也可以用,不

受两组数据个数的差异限制。

⑥实际作用:

1°直接比较:

同一时间事物或现象的整齐性、均匀性、一致性的差异;

不同时间过程的稳定性、均衡性、一致性的差异;

2°比较平均数的代表性:

3°与平均数配合作统计分析:如:Vδ=

4°样本估计总体。样本比较估计总体的差异,用样本

标准差,估计总体标准差。

*样本估计总体的方法有两个:点估计和区间估计。

只要求会点估计,即直接用样本的特征数作为总体

相应参数的估计值。

4.标准差(SD)

由于方差是数据的平方,与检测值本身相差太大,人们难以直观的衡量,所以常用方差开根号换算回来这就是我们要说的标准差。

5.变异系数(CV)

标准差能很客观准确的反映一组数据的离散程度,但是对于不同的项目,或同一项目不同的样本,标准差就缺乏可比性了,因此对于方法学评价来说又引入了变异系数CV。

不过日常的质控工作检测的都是同一质控物所以有标准差就足以反应了,同时质控的目的是发现有没有实验错误,要设制警报线,并不是要评价检测方法,所以只可能使用标准差,而不用变异系数。

频数分布:

①频数的通俗解释:频数出现的次数,小组里数据的个

数。

②数据的分组整理——分三个步骤:

一是确实分组的方法,先分组,这是整理的难点,分

组的方法,根据需要确定。分组的方法确定《课

标》不作要求。

二是累计各小组的频数,并计算相应的频率,用频数

分布表表示整理的结果。

三是根据频数分布表画出频数分布直方图。

③观察频数分布表和分布图,获得数据分布的信息和分布

特征。

1°数据分布最多,最集中(众数组)和最少的小组;

2°数据分布(频数)的变化趋势与分布状态;

3°中位数和平均数在哪个小组,是否是偏态分布;

4°获取所需要的其他数据信息。

相关词条

相关搜索

其它词条