卡方檢驗

卡方檢驗

假設檢驗方法
卡方檢驗是用途非常廣的一種假設檢驗方法,它在分類資料統計推斷中的應用,包括:兩個率或兩個構成比比較的卡方檢驗;多個率或多個構成比比較的卡方檢驗以及分類資料的相關分析等。[1]
    中文名:卡方檢驗 外文名: 适用領域: 所屬學科: 種類:假設檢驗方法 應用:分類資料統計推斷 作用:資料分析 定義:觀測值與理論值之間的偏離程度

基本原理

卡方檢驗就是統計樣本的實際觀測值與理論推斷值之間的偏離程度,實際觀測值與理論推斷值之間的偏離程度就決定卡方值的大小,卡方值越大,越不符合;卡方值越小,偏差越小,越趨于符合,若兩個值完全相等時,卡方值就為0,表明理論值完全符合。

注意:卡方檢驗針對分類變量。

步驟

(1)提出原假設:

H0:總體X的分布函數為F(x)。

如果總體分布為離散型,則假設具體為

H0:總體X的分布律為P{X=xi}=pi,i=1,2,...

(2)将總體X的取值範圍分成k個互不相交的小區間A1,A2,A3,…,Ak,如可取A1=(a0,a1],A2=(a1,a2],...,Ak=(ak-1,ak),其中a0可取-∞,ak可取+∞,區間的劃分視具體情況而定,但要使每個小區間所含的樣本值個數不小于5,而區間個數k不要太大也不要太小。

(3)把落入第i個小區間的Ai的樣本值的個數記作fi,成為組頻數(真實值),所有組頻數之和f1+f2+...+fk等于樣本容量n。

(4)當H0為真時,根據所假設的總體理論分布,可算出總體X的值落入第i個小區間Ai的概率pi,于是,npi就是落入第i個小區間Ai的樣本值的理論頻數(理論值)。

(5)當H0為真時,n次試驗中樣本值落入第i個小區間Ai的頻率fi/n與概率pi應很接近,當H0不真時,則fi/n與pi相差很大。基于這種思想,皮爾遜引進如下檢驗統計量,在0假設成立的情況下服從自由度為k-1的卡方分布。

資料檢驗

(自由度df=(C-1)(R-1))行×列表資料的卡方檢驗用于多個率或多個構成比的比較。

1.專用公式:r行c列表資料卡方檢驗的卡方值=n[(A11/n1n1+A12/n1n2+...+Arc/nrnc)-1]

2.應用條件:要求每個格子中的理論頻數T均大于5或1

列聯表資料檢驗

同一組對象,觀察每一個個體對兩種分類方法的表現,結果構成雙向交叉排列的統計表就是列聯表。

1.R*C列聯表的卡方檢驗:R*C列聯表的卡方檢驗用于R*C列聯表的相關分析,卡方值的計算和檢驗過程與行×列表資料的卡方檢驗相同。

2.2*2列聯表的卡方檢驗:2*2列聯表的卡方檢驗又稱配對記數資料或配對四格表資料的卡方檢驗,根據卡方值計算公式的不同,可以達到不同的目的。當用一般四格表的卡方檢驗計算時,卡方值=n(ad-bc)^2/[(a+b)(c+d)(a+c)(b+d)],此時用于進行配對四格表的相關分析,如考察兩種檢驗方法的結果有無關系;當卡方值=(|b-c|-1)2/(b+c)時,此時卡方檢驗用來進行四格表的差異檢驗,如考察兩種檢驗方法的檢出率有無差别。

列聯表卡方檢驗應用中的注意事項同R*C表的卡方檢驗相同。

上一篇:堆棧指針

下一篇:十六進制數

相關詞條

相關搜索

其它詞條