日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

統(tǒng)計(jì)?我懂個(gè)P!

 智慧之吻 2016-06-17

也不知道P值是誰惹誰了,反正大家都喜歡拿他開刷!老早就有一篇爭(zhēng)議挺大的公眾號(hào)文章說「P值已死」,立馬就有人反駁「別鬧了,P值沒死」。其實(shí), Nature雜志在14年2月份時(shí)就刊發(fā)了一篇文章,對(duì)統(tǒng)計(jì)效度的金標(biāo)準(zhǔn)「P值」提出了質(zhì)疑,認(rèn)為P值并沒有統(tǒng)計(jì)學(xué)家所認(rèn)為的那樣可信。


我們暫且把這個(gè)問題擱置一下,替P值君問一句:「為什么受傷的總是我呀?是我是我還是我」真要說起個(gè)問題,咱們得從統(tǒng)計(jì)學(xué)的框架說起。


現(xiàn)代統(tǒng)計(jì)學(xué)的框架


現(xiàn)代統(tǒng)計(jì)學(xué)兩分天下:一分統(tǒng)計(jì)描述,一分統(tǒng)計(jì)推斷。統(tǒng)計(jì)書上經(jīng)常這樣表述:統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷是現(xiàn)代統(tǒng)計(jì)學(xué)的兩個(gè)組成部分,兩者相輔相成、缺一不可,統(tǒng)計(jì)描述是現(xiàn)代統(tǒng)計(jì)學(xué)的基礎(chǔ)和前提,統(tǒng)計(jì)推斷是現(xiàn)代統(tǒng)計(jì)學(xué)的核心和關(guān)鍵。



統(tǒng)計(jì)描述就是給數(shù)據(jù)拍張快照唄,看看他們長(zhǎng)什么樣子。我們熟知的均數(shù)、中位數(shù)就是用來看他們?cè)训奈恢?,扎在什么地方;?biāo)準(zhǔn)差、四分位數(shù)間距等就是用來看他們?cè)训某潭?,扎得有多緊。當(dāng)然我們也可以用直方圖,箱線圖,散點(diǎn)圖等統(tǒng)計(jì)圖形來更為形象直觀的查看。


統(tǒng)計(jì)推斷是用我們手中的樣本數(shù)據(jù)來推斷其背后的總體特征。統(tǒng)計(jì)推斷里有兩大塊內(nèi)容:參數(shù)估計(jì)和假設(shè)檢驗(yàn)。參數(shù)估計(jì)就是我們用樣本的統(tǒng)計(jì)量(如樣本均數(shù))去估計(jì)總體的參數(shù)(如總體均數(shù))。此時(shí),我們可以有兩種策略:一種是簡(jiǎn)單了事,直接把樣本統(tǒng)計(jì)量當(dāng)做總體參數(shù),這就是所謂的點(diǎn)估計(jì);另外一種策略就是考慮到抽樣誤差,我們用一個(gè)范圍,而不是一個(gè)單一的值去估計(jì)總體參數(shù),此即所謂的區(qū)間估計(jì)。而假設(shè)檢驗(yàn)則是利用小概率反正法思想,從問題的對(duì)立面(H0,原假設(shè))出發(fā),假定H0成立的條件下,去計(jì)算檢驗(yàn)統(tǒng)計(jì)量,獲得P值,再通過P值來在H0,H1(備擇假設(shè))之間做進(jìn)一步取舍。



既然統(tǒng)計(jì)推斷是現(xiàn)代統(tǒng)計(jì)學(xué)的核心和關(guān)鍵,看到這里,你也能體會(huì)到作為假設(shè)檢驗(yàn)的黃金判定標(biāo)準(zhǔn)的P值,在統(tǒng)計(jì)學(xué)中的地位啦。那具體而言,什么是P值呢?


P值和假設(shè)檢驗(yàn)


什么是P值呢?按照頻率學(xué)派的經(jīng)典套路:

  • 敷衍的人會(huì)告訴你:「P值啊,就是P Value,Probability Value,就是概率啊」聽完我們想揍死他,你還別笑,有些統(tǒng)計(jì)培訓(xùn)班還真這么講的

  • 老實(shí)本分的老師會(huì)告訴你: 「P值啊,就是在H0為真的條件下,獲得當(dāng)前樣本或者更偏的樣本的概率」。聽完我們很迷茫啊,看著我們迷茫的眼神,老師無奈的寫下「P=Prob(X|H0)」,我們只好無奈且善意的點(diǎn)點(diǎn)頭

  • 少有的明白人會(huì)告訴你:P值啊,就是在H0為真時(shí),觀察到的差異來源于抽樣誤差的可能性大小


P值就是在H0為真時(shí),觀察到的差異來源于抽樣誤差的可能性大小。聽完這個(gè)解釋,或許我們眼前能閃現(xiàn)一絲靈光。我們以正態(tài)分布的Z檢驗(yàn)為例簡(jiǎn)要說明下,不知道不理解為什么那么多的統(tǒng)計(jì)教材竟然要以t檢驗(yàn)為例來講假設(shè)檢驗(yàn)。如果你被他們毒害了,不知道什么是Z檢驗(yàn),請(qǐng)看如下公式:




看不懂?不著急。一步一步來。依據(jù)「P值就是在H0為真時(shí),觀察到的差異來源于抽樣誤差的可能性的大小」這一定義,我們假定H0為真,也就是假定樣本均數(shù)「X Bar」(即X頭上抬根杠,微信編輯器什么時(shí)候能插入公式啊,只好擬音啦) 就等于總體均數(shù)「miu」(擬音),但是實(shí)際上,我們利用手中的樣本數(shù)據(jù)計(jì)算的均數(shù) 「X Bar和總體均數(shù)「miu總是有差異的,這個(gè)差異就是公式中的分子,但是這個(gè)差異缺乏一個(gè)統(tǒng)一的度量,于是 我們除以一個(gè) 總體的變異幅度(暫且用標(biāo)準(zhǔn)誤代替,也就是上圖中的分母), 這樣就得到一個(gè)以總體變異幅度來度量的差異,也就是說這個(gè)差異是多個(gè)標(biāo)準(zhǔn)誤,或者說差了多少個(gè)標(biāo)準(zhǔn)誤的距離,這個(gè)就是我們所說的統(tǒng)計(jì)量,Z值?,F(xiàn)在在看看Z檢驗(yàn)的公式,是否好容易理解多了? 統(tǒng)計(jì)量Z值其實(shí)就是樣本均數(shù)和總體均數(shù)相差的,以標(biāo)準(zhǔn)誤度量的單位量。


那么P值呢?別急。每一個(gè)Z值可以對(duì)應(yīng)到一個(gè)相應(yīng)的P值,比如,Z=1.96表示 差了1.96倍標(biāo)準(zhǔn)誤的距離,對(duì)應(yīng)的P 值就是0.05。





但是不同的分布,統(tǒng)計(jì)量不同,因此難以標(biāo)化統(tǒng)一,不過P 值卻可以,而且在實(shí)際操作中,由于計(jì)算機(jī)統(tǒng)計(jì)軟件包的發(fā)展,P值也很容易獲得。 獲得P值后,比如,比如啊,P=0.003,我們可以回過頭來想:既然我們已經(jīng)假定H0為真了,也就是(「X Bar」-「miu」)應(yīng)該沒有差異了,但是現(xiàn)在還有Z倍標(biāo)準(zhǔn)誤的差異啊! 那現(xiàn)在這個(gè)差異是哪里來的呢?只有一個(gè)可能的原因:抽樣誤差。但是現(xiàn)在可以歸因于抽樣誤差的概率很小,只有0.003?。ńy(tǒng)計(jì)軟件計(jì)算結(jié)果),0.003的概率,1000次也才3次,竟然一次就讓我們趕上了,這不太可能吧?是的,確實(shí)不太可能。那我們就只能回過頭來懷疑我們的根基,我們的原假設(shè)H0錯(cuò)了,因此我們否定H0, 接受H1。




這才是我們的假設(shè)檢驗(yàn)。這才是我們的P值。既然P值是假定H0為真的條件下,我們所觀察到的差異來源于抽樣誤差的概率。這很容易讓我們想到,如果H0真的為真,我們因P值<>


I類錯(cuò)誤的概率是不是P值呢?To P or not to P, that's a question。 要說起清楚這個(gè)問題,還得勞神費(fèi)心另寫一篇:假設(shè)檢驗(yàn)的前世今生。


P.S.部分圖片來自Google搜索。



按: SAS官方在1月15日,北上廣三地同時(shí)有線下活動(dòng),感興趣的可以去看看。北京這邊某人有一個(gè)「醫(yī)學(xué)研究里的SAS PROC和SAS 繪圖主題的分享」,可以去捧場(chǎng),或者踢館!報(bào)名:http://club./Active.aspx

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多