我們?nèi)粘Uf的概率,有多種內(nèi)涵。比如拋硬幣得到正面的概率為0.5,這是跟硬幣的本身構(gòu)造有關(guān)系的,這被稱為習(xí)性理論,每次拋硬幣只跟硬幣本身有關(guān),跟前一次后一次的結(jié)果無關(guān)。 比如降雨概率,這是跟百分比有關(guān)的。根據(jù)歷史的氣象資料,然后再根據(jù)現(xiàn)在氣象的監(jiān)測數(shù)據(jù),推斷今天的降雨概率,這種判斷之后的結(jié)果會影響下一次判斷。 比如我認(rèn)為神馬今天在群里冒泡的概率為0.1,這種是主觀的概念,是基于個人認(rèn)知,個人效用計算的。 一般統(tǒng)計學(xué)里主要的概率,就是區(qū)間估計。比如有一堆數(shù)字,我隨機抽取,然后認(rèn)為在0.95的置信水平下,它能落在5~10之間。也就是,抽取100次,會有95次抽取的數(shù)字在[5,10]里面。 0.95是個經(jīng)驗值,一般這么認(rèn)為,現(xiàn)在統(tǒng)計學(xué)家認(rèn)為這不是個好數(shù)字,做統(tǒng)計的應(yīng)該在數(shù)據(jù)分析明確表現(xiàn)出他的置信水平。 概率(1):馬爾可夫鏈 在高中學(xué)初等概率時,一般都強調(diào)事件與事件之間相互獨立,但是在有些情況下是不獨立的。不獨立的話,就會有相關(guān)性,馬爾可夫鏈講的就是這類相關(guān)。 舉個例子,這有一枚硬幣,正反兩面,經(jīng)過測試,它是無偏向的,正面反面的概率各為0.5?,F(xiàn)在規(guī)則如下:假設(shè)初始值S=0,讓你拋這枚硬幣,如果是正面,那么就加一,S=S+1;如果是反面,就減一,S=S-1。如果S大于等于0,就記為藍色,如果S小于0,就記為紅色。當(dāng)你不斷地拋硬幣,然后就會得到一個序列,像“紅藍藍藍紅紅……”之類。這就是一條馬爾可夫鏈。 然后有科學(xué)家進行實際測試,發(fā)現(xiàn)結(jié)果中,紅藍的比例不是1:1,而是有很大的偏差。 所以,在馬爾可夫鏈的例子里我們并不能用在獨立條件下的那套計算方法,雖然上面那個例子中拋硬幣是個獨立的過程。 深入地理解一下,比如某一次S=3,即這一次是藍色,無論下一次硬幣是正面(+1),或是反面(-1),結(jié)果S都大于0,即結(jié)果都是藍色。 馬爾可夫鏈在日常生活中很常見,比如天氣。昨天的天氣跟今天的天氣有很大程度的相關(guān),而前天,乃至大前天的天氣可能就跟今天的天氣沒有關(guān)系。(這個例子就是馬爾可夫鏈的定義) 馬爾可夫鏈的引入,在書中是來自一個反常的現(xiàn)象,即波普爾提出來的關(guān)于太陽東升的例子。在過去的7000多年里,有史料記錄,太陽每次都是東升的,大概是7000x360次(粗略計算)。假如明天,太陽不東升了。讓你預(yù)測后天太陽東升的概率。如果按照獨立性的那套來計算,那么p=(7000x360)/(7000x360+1)=0.9999996~1。也就是說,后天太陽依舊會東升。但這種想法明顯是反常的。 太陽東升也是馬爾可夫鏈,不能這么算,所以出了這樣的差錯。波普爾利用這個例子來引出它的那個猜想與反駁的觀念(用一個解釋力更強的假說替代原假說)。 |
|