變異系數

變異系數

數學術語
變異系數(Coefficient of Variation):當需要比較兩組數據離散程度大小的時候,如果兩組數據的測量尺度相差太大,或者數據量綱的不同,直接使用标準差來進行比較不合适,此時就應當消除測量尺度和量綱的影響,而變異系數可以做到這一點,它是原始數據标準差與原始數據平均數的比。CV沒有量綱,這樣就可以進行客觀比較了。事實上,可以認為變異系數和極差、标準差和方差一樣,都是反映數據離散程度的絕對值。其數據大小不僅受變量值離散程度的影響,而且還受變量值平均水平大小的影響。
    中文名:變異系數 外文名:Coefficient of Variation 别名: 應用領域:數學 類 别:計數方法 别 名:離散系數 定 義:概率分布離散程度的歸一化量度

定義

在概率論和統計學中,變異系數,又稱“離散系數”(英文:coefficient of variation),是概率分布離散程度的一個歸一化量度,其定義為标準差與平均值之比:

變異系數(coefficient of variation)隻在平均值不為零時有定義,而且一般适用于平均值大于零的情況。變異系數也被稱為标準離差率或單位風險。

變異系數隻對由比率标量計算出來的數值有意義。舉例來說,對于一個氣溫的分布,使用開爾文或攝氏度來計算的話并不會改變标準差的值,但是溫度的平均值會改變,因此使用不同的溫标的話得出的變異系數是不同的。也就是說,使用區間标量得到的變異系數是沒有意義的。

基本含義

一般來說,變量值平均水平高,其離散程度的測度值越大,反之越小。

變異系數是衡量資料中各觀測值變異程度的另一個統計量。當進行兩個或多個資料變異程度的比較時,如果度量單位與平均數相同,可以直接利用标準差來比較。如果單位和(或)平均數不同時,比較其變異程度就不能采用标準差,而需采用标準差與平均數的比值(相對值)來比較。标準差與平均數的比值稱為變異系數,記為C·V。變異系數可以消除單位和(或)平均數不同對兩個或多個資料變異程度比較的影響。

變異系數的計算公式為:變異系數 C·V =( 标準偏差 SD / 平均值Mean )× 100%

在進行數據統計分析時,如果變異系數大于15%,則要考慮該數據可能不正常,應該剔除。

舉例

已知某良種豬場長白成年母豬平均體重為190kg,标準差為10.5kg,而大約克成年母豬平均體重為196kg,标準差為8.5kg,試問兩個品種的成年母豬,哪一個體重變異程度大。

此例觀測值雖然都是體重,單位相同,但它們的平均數不相同,隻能用變異系數來比較其變異程度的大小。

由于,長白成年母豬體重的變異系數:C.V = 10.5 / 190 * 100% = 5.53%

大約克成年母豬體重的變異系數:C.V = 8.5 / 196 * 100% = 4.34%

所以,長白成年母豬體重的變異程度大于大約克成年母豬。

注意,變異系數的大小,同時受平均數和标準差兩個統計量的影響,因而在利用變異系數表示資料的變異程度時,最好将平均數和标準差也列出。

公式

(标準偏差SD、平均值MN)

優缺點

優點

比起标準差來,變異系數的好處是不需要參照數據的平均值。變異系數是一個無量綱量,因此在比較兩組量綱不同或均值不同的數據時,應該用變異系數而不是标準差來作為比較的參考。

缺陷

當平均值接近于0的時候,微小的擾動也會對變異系數産生巨大影響,因此造成精确度不足。

變異系數無法發展出類似于均值的置信區間的工具。

應用

變異系數在概率論的許多分支中都有應用,比如說在更新理論、排隊理論和可靠性理論中。在這些理論中,指數分布通常比正态分布更為常見。

由于指數分布的标準差等于其平均值,所以它的變異系數等于一。變異系數小于一的分布,比如愛爾朗分布稱為低差别的,而變異系數大于一的分布,如超指數分布則被稱為高差别的。

上一篇:組織結構

下一篇:風險

相關詞條

相關搜索

其它詞條