假設(shè)檢驗(yàn)1、假設(shè)檢驗(yàn)的由來我們先看一個(gè)例子: 那么如何檢驗(yàn)這位女士的說法呢?FISHER進(jìn)行了研究,從而提出了假設(shè)檢驗(yàn)的思想。 比如: 正常情況下我們?nèi)ゲ孪鹊共柽€是先倒牛奶的話,概率應(yīng)該是1/2, 1.總共檢驗(yàn)了兩杯,全部猜對(duì)的概率是:0.5??0.5=0.25,雖然概率很低,但是也算正常; 2.繼續(xù)猜,又猜了兩次,也全部猜對(duì)了幾率是 3.我們繼續(xù)猜,加大樣本,如果連續(xù)猜對(duì)10杯,那么我認(rèn)為這位女士確實(shí)有特殊的能力。 雖然我們上面說猜對(duì)10杯來確認(rèn)這位女士有特殊能力,這只是我們的臆測,我們假設(shè)一個(gè)x,當(dāng)這位女士能夠猜對(duì)x杯才認(rèn)為這位女士確實(shí)有特殊的能力,其實(shí)對(duì)于我們最難的是來確認(rèn)著x。 下面我們就來看一下怎么樣來確認(rèn)這個(gè)x。
2、什么是假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)(Hypothesis Testing):是推斷統(tǒng)計(jì)的最后一步,是依據(jù)一定的假設(shè)條件由樣本推斷總體的一種方法。 你提出你的假設(shè):說你有特殊的能力,可以品出先倒茶還是牛奶; 我提出要檢驗(yàn)?zāi)愕募僭O(shè):品十(x)杯,看實(shí)驗(yàn)結(jié)果是不是和你說的假設(shè)相符
假設(shè)檢驗(yàn)其實(shí)就是假設(shè)和檢驗(yàn)兩步,先提出假設(shè),之后再來驗(yàn)證假設(shè)是不是合理的。 3、P值為了完成假設(shè)檢驗(yàn),需要先定義一個(gè)概念:P值。 根據(jù)上面的描述,這里假設(shè)檢驗(yàn)的思路就是:
猜奶茶的實(shí)驗(yàn)應(yīng)該符合二項(xiàng)分布(這就不解釋了),也就是:
在我們認(rèn)為猜之前沒有泄密(也就是確實(shí)是憑自己的嗅覺去猜)的前提下,猜10次應(yīng)該符合以下分布:
下圖表示的就是,假如猜是公平的情況下的分布圖:
也就是說猜10次能猜對(duì)8次的概率是0.0439 為了方便大家計(jì)算,附上python代碼:
把八次猜對(duì)概率,與更極端的九次猜對(duì)、十次猜對(duì)的概率加起來: 為什么要把更極端的情況加起來? 根據(jù)猜奶茶這個(gè)例子,可能你會(huì)覺得,我知道八次猜對(duì)出現(xiàn)不正常就行了,干嘛要把九次、十次加起來? 比如我們要猜1000次用二項(xiàng)分布來計(jì)算很麻煩,根據(jù)中心極限定理,我們知道,可以用正態(tài)分布來近似: 但是,對(duì)于正態(tài)分布,我沒有辦法算單點(diǎn)的概率(連續(xù)分布單點(diǎn)概率為0),我只能取一個(gè)區(qū)間來算極限,所以就取530、以及更極端的點(diǎn)組成的區(qū)間: (我上面只取了單側(cè)P值,說明下:取單側(cè)還是雙側(cè),取決于你的應(yīng)用,什么叫做更極端的點(diǎn),也取決于你的應(yīng)用) 3.1、單側(cè)檢驗(yàn)
3.2 雙側(cè)檢驗(yàn)
4、顯著水平總共猜10次,那么是出現(xiàn)7次猜對(duì),可以認(rèn)為有特殊能力,還是9次猜對(duì)之后我才能確認(rèn)有特殊能力,這是一個(gè)較為主觀的標(biāo)準(zhǔn)。 我們一般認(rèn)為 P-value<=0.05 就可以認(rèn)為假設(shè)是不正確的。 0.05這個(gè)標(biāo)準(zhǔn)就是顯著水平,當(dāng)然選擇多少作為顯著水平也是主觀的。
我們可以認(rèn)為剛開始的假設(shè)(這位女士不能準(zhǔn)確的猜出先倒茶還是牛奶)錯(cuò)的很“顯著”,也就是是有特殊能力的。 5、假設(shè)檢驗(yàn)步驟我們回顧下我們剛才所說的,總結(jié)下: 這里簡單說下檢驗(yàn)統(tǒng)計(jì)量
6、實(shí)例我們這里舉2個(gè)例子: 首先我們先引入一個(gè)檢驗(yàn)統(tǒng)計(jì)量分布的選擇規(guī)則 例1:
我們知道總體均值和總體方差,根據(jù)上圖的規(guī)則可以看出我們可以用Z統(tǒng)計(jì)量:
例2:
本例自由度v=n-1=35-1=34,查表得得t0.05/2,34=2.032。 因?yàn)閠 < t0.05/2,34,故P>0.05,按 α=0.05水準(zhǔn),不拒絕H0,差別無統(tǒng)計(jì)學(xué)意義,尚不能認(rèn)為該地難產(chǎn)兒與一般新生兒平均出生體重不同。
以上就是對(duì)假設(shè)檢驗(yàn)思想的一個(gè)簡單介紹,其實(shí)對(duì)于理論的介紹理解起來比較晦澀,就像我們用1+1=2很簡單,要是理解1+1為什么等于2就難了。假設(shè)檢驗(yàn)在運(yùn)用的時(shí)候就像最后的兩個(gè)例子,其實(shí)是很簡單的,但是對(duì)于理論的理解就需要比較長的時(shí)間。 |
|