概述及曆史
在概率論和統計學中,(Student'st-distribution)經常應用在對呈正态分布的總體的均值進行估計。它是對兩個樣本均值差異進行顯着性測試的學生t測定的基礎。t檢定改進了Z檢定(en:Z-test),不論樣本數量大或小皆可應用。在樣本數量大(超過120等)時,可以應用Z檢定,但Z檢定用在小的樣本會産生很大的誤差,因此樣本很小的情況下得改用學生t檢定。在數據有三組以上時,因為誤差無法壓低,此時可以用變異數分析代替學生t檢定。
當母群體的标準差是未知的但卻又需要估計時,可以運用學生t-分布。
學生t-分布可簡稱為t分布。其推導由威廉·戈塞于1908年首先發表,當時他還在都柏林的健力士釀酒廠工作。因為不能以他本人的名義發表,所以論文使用了學生(Student)這一筆名。之後t檢驗以及相關理論經由羅納德·費雪的工作發揚光大,而正是他将此分布稱為學生分布。
簡介
u分布
正态分布(normaldistribution)是數理統計中的一種重要的理論分布,是許多統計方法的理論基礎。正态分布有兩個參數,μ和σ,決定了正态分布的位置和形态。為了應用方便,常将一般的正态變量X通過u變換[(X-μ)/σ]轉化成标準正态變量u,以使原來各種形态的正态分布都轉換為μ=0,σ=1的标準正态分布(standardnormaldistribution),亦稱u分布。
根據中心極限定理,通過上述的抽樣模拟試驗表明,在正态分布總體中以固定n,抽取若幹個樣本時,樣本均數的分布仍服從正态分布,即N(μ,σ)。所以,對樣本均數的分布進行u變換,也可變換為标準正态分布N(0,1)
t分布
由于在實際工作中,往往σ是未知的,常用s作為σ的估計值,為了與u變換區别,稱為t變換,統計量t值的分布稱為t分布。
假設X服從标準正态分布N(0,1),Y服從χ2(n)分布,那麼Z=X/sqrt(Y/n)的分布稱為自由度為n的t分布,記為Z~t(n)。
特征
1.以0為中心,左右對稱的單峰分布;
2.t分布是一簇曲線,其形态變化與n(确切地說與自由度ν)大小有關。自由度ν越小,t分布曲線越低平;自由度ν越大,t分布曲線越接近标準正态分布(u分布)曲線。
t(n)分布與标準正态N(0,1)的密度函數
對應于每一個自由度ν,就有一條t分布曲線,每條曲線都有其曲線下統計量t的分布規律,計算較複雜。
學生的t分布(或也t分布),在概率統計中,在置信區間估計、顯着性檢驗等問題的計算中發揮重要作用。
t分布情況出現時(如在幾乎所有實際的統計工作)的總體标準偏差是未知的,并要從數據估算。教科書問題的處理标準偏差,因為如果它被稱為是兩類:(1)那些在該樣本規模是如此之大的一個可處理的數據為基礎估計的差異,就好像它是一定的(2)這些說明數學推理,在其中的問題,估計标準偏差是暫時忽略的,因為這不是一點,這是作者或導師當時的解釋。
表格
下表列出了自由度為1-30以及80、100、120等t-分布的單側和雙側區間值。例如,當樣本數量n=5時,則自由度v=4,就可以查找表中以4開頭的行。該行第5列值為2.132,對應的單側值為95%(雙側值為90%)。這也就是說,T小于2.132的概率為95%(即單側),記為Pr(−∞
這是根據分布的對稱性計算得到的,Pr(T<−2.132)=1−Pr(T>−2.132)=1−0.95=0.05,
因此,Pr(−2.132
注意關于表格的最後一行的值:自由度為無限大(n=120)的t-分布和正态分布等價。
相關研究
貝葉斯理論框架主要分為兩個部分,一個是先驗分布,一個是似然函數。目前反演中所用的先驗分布基本聚焦在高斯分布、Huber分布、柯西分布以及改進柯西分布等,以此構建出的貝葉斯框架在特定地區反演效果較好,但其普适性較小。通過對多個地區的多口井數據進行提取統計,發現待反演參數基本滿足t分布,而與高斯分布、柯西分布等存在較大誤差。
鑒于此,構建了以t分布為先驗函數的貝葉斯反演算法。該算法可以通過對自由度的選擇來适應參數分布不同的多種地區,通過提高先驗信息的吻合度,增加了後驗函數的可信性,保證了反演的效果。模型試算表明,基于t分布為先驗分布的貝葉斯反演方法具有較高的分辨率和較好的穩定性。實際資料的疊前彈性參數反演表明,該方法反演結果準确可靠。



















