定義
在概率論和統計學中,變異系數,又稱“離散系數”(英文:coefficient of variation),是概率分布離散程度的一個歸一化量度,其定義為标準差與平均值之比:
變異系數(coefficient of variation)隻在平均值不為零時有定義,而且一般适用于平均值大于零的情況。變異系數也被稱為标準離差率或單位風險。
變異系數隻對由比率标量計算出來的數值有意義。舉例來說,對于一個氣溫的分布,使用開爾文或攝氏度來計算的話并不會改變标準差的值,但是溫度的平均值會改變,因此使用不同的溫标的話得出的變異系數是不同的。也就是說,使用區間标量得到的變異系數是沒有意義的。
基本含義
一般來說,變量值平均水平高,其離散程度的測度值越大,反之越小。
變異系數是衡量資料中各觀測值變異程度的另一個統計量。當進行兩個或多個資料變異程度的比較時,如果度量單位與平均數相同,可以直接利用标準差來比較。如果單位和(或)平均數不同時,比較其變異程度就不能采用标準差,而需采用标準差與平均數的比值(相對值)來比較。标準差與平均數的比值稱為變異系數,記為C·V。變異系數可以消除單位和(或)平均數不同對兩個或多個資料變異程度比較的影響。
變異系數的計算公式為:變異系數 C·V =( 标準偏差 SD / 平均值Mean )× 100%
在進行數據統計分析時,如果變異系數大于15%,則要考慮該數據可能不正常,應該剔除。
舉例
已知某良種豬場長白成年母豬平均體重為190kg,标準差為10.5kg,而大約克成年母豬平均體重為196kg,标準差為8.5kg,試問兩個品種的成年母豬,哪一個體重變異程度大。
此例觀測值雖然都是體重,單位相同,但它們的平均數不相同,隻能用變異系數來比較其變異程度的大小。
由于,長白成年母豬體重的變異系數:C.V = 10.5 / 190 * 100% = 5.53%
大約克成年母豬體重的變異系數:C.V = 8.5 / 196 * 100% = 4.34%
所以,長白成年母豬體重的變異程度大于大約克成年母豬。
注意,變異系數的大小,同時受平均數和标準差兩個統計量的影響,因而在利用變異系數表示資料的變異程度時,最好将平均數和标準差也列出。
公式
(标準偏差SD、平均值MN)
優缺點
優點
比起标準差來,變異系數的好處是不需要參照數據的平均值。變異系數是一個無量綱量,因此在比較兩組量綱不同或均值不同的數據時,應該用變異系數而不是标準差來作為比較的參考。
缺陷
當平均值接近于0的時候,微小的擾動也會對變異系數産生巨大影響,因此造成精确度不足。
變異系數無法發展出類似于均值的置信區間的工具。
應用
變異系數在概率論的許多分支中都有應用,比如說在更新理論、排隊理論和可靠性理論中。在這些理論中,指數分布通常比正态分布更為常見。
由于指數分布的标準差等于其平均值,所以它的變異系數等于一。變異系數小于一的分布,比如愛爾朗分布稱為低差别的,而變異系數大于一的分布,如超指數分布則被稱為高差别的。



















