今年全國(guó)卷2的高考作文題,有人說(shuō)難,更多人說(shuō)好。 怎么一個(gè)難法,怎么一個(gè)好法,這里不講。那是高中老師們的活兒,不搶生意。 這里只講作文題目里主人公的故事,數(shù)彈孔的統(tǒng)計(jì)學(xué)家,亞伯拉罕·瓦爾德(或者翻譯為沃爾德)。 亞伯拉罕·瓦爾德,猶太人,1902出生于克勞森堡(當(dāng)時(shí)屬于奧匈帝國(guó),現(xiàn)在屬于羅馬利亞)。 瓦爾德就是他,考沒考好就應(yīng)記住 瓦爾德是位神童,也是一位學(xué)霸,1931年獲得維也納大學(xué)的數(shù)學(xué)博士學(xué)位。1938年,納粹德國(guó)占領(lǐng)奧地利,瓦爾德幸運(yùn)而順利地逃到了美國(guó),進(jìn)入了哥倫比亞大學(xué)的統(tǒng)計(jì)研究小組。 這個(gè)小組里,全是世界級(jí)牛人,世界最頂尖的頭腦。比如,弗雷德里克.莫斯特勒,哈佛大學(xué)統(tǒng)計(jì)系的創(chuàng)建者,比如,諾伯特維納,控制論的創(chuàng)始人。 統(tǒng)計(jì)小組工作的地方 由于美國(guó)空軍迫切需要解決戰(zhàn)機(jī)損失率的問題,找到了瓦爾德。按照軍方的統(tǒng)計(jì),機(jī)身上的彈孔數(shù)最多,如下表。 把彈孔數(shù)打在飛機(jī)圖上,就是這樣,如下。 為提高飛機(jī)的生存率,最好的辦法是加裝甲。但是,又不能加太多,否則影響飛機(jī)性能。 所以,裝甲只能加在最需要的地方。 從圖表看,軍方的意見是機(jī)身。 而瓦爾德的意見恰恰相反,是引擎。因?yàn)橐嬷袕椀娘w機(jī),大多數(shù)飛不回來(lái)了。 如果只關(guān)注那些順利返航的飛機(jī)的中彈情況,就會(huì)陷入邏輯誤區(qū),這就是大名鼎鼎的幸存者偏差(survivorship bias),或者是生存偏差。 這個(gè)理論,演繹出一套算法,到現(xiàn)在仍在運(yùn)用。像臉書等科技公司,分析用戶偏好、處理用戶數(shù)據(jù)的時(shí)候,就用到了瓦爾德的理論。 軍方按瓦爾德的意見,給引擎加了裝甲,飛機(jī)的損失率果然大大降低。 除了這件牛事,瓦爾德在二戰(zhàn)期間還作了一個(gè)大貢獻(xiàn)。 軍方在驗(yàn)收彈藥時(shí),遇到難題。比如,收到生產(chǎn)商送來(lái)的10萬(wàn)發(fā)子彈,怎么知道這批子彈合格不合格呢? 最好的辦法是把這10萬(wàn)子彈一個(gè)一個(gè)打出去,就清楚多少是好子彈,多少是壞子彈了。 但是,這樣子彈就沒了。 常規(guī)的做法是抽樣調(diào)查。先確定一個(gè)抽驗(yàn)數(shù)量,抽取1%的子彈出來(lái),就是1000顆子彈,全部打出去,打完之后,得到合格率。 不過(guò)這樣的成本大不說(shuō),耗時(shí)長(zhǎng),效率還低。 瓦爾德提出了一個(gè)全新的辦法,序貫分析。在抽樣時(shí),不事先規(guī)定總的抽樣個(gè)數(shù)(觀測(cè)或?qū)嶒?yàn)次數(shù)),而是先抽少量樣本,根據(jù)其結(jié)果,再?zèng)Q定停止抽樣或繼續(xù)抽樣、抽多少,這樣下去,直至決定停止抽樣為止。 比如驗(yàn)收10萬(wàn)發(fā)子彈,要求合格率99%。先打100發(fā)子彈,如果不合格的子彈大于1,就不用再測(cè)試了,這批子彈極可能不符合要求;如果不合格的子彈小于1,通過(guò)數(shù)學(xué)計(jì)算,來(lái)判定下面還需不需要接著抽樣,還要抽驗(yàn)多少。 序貫分析,在保證驗(yàn)收結(jié)果準(zhǔn)確性的前提下,大大提高了軍需物資的驗(yàn)收效率,大大減少了浪費(fèi)——原來(lái)需要打1000發(fā)子彈才能確定的合格率,可以只需要打二三百發(fā)就行了。 幸存者偏差是一種理性思維、系統(tǒng)思維,而序貫分析是一種開創(chuàng)性的數(shù)學(xué)思想。 在序貫分析和序貫分析的基礎(chǔ)上,瓦爾德提出一套全新的理論——統(tǒng)計(jì)決策論。 他認(rèn)為,數(shù)據(jù)的采集、分析,不單是為了獲取信息,更重要的是,由此進(jìn)行科學(xué)的決策。 戰(zhàn)后,瓦爾德將他的思想整理成一部著作《序貫分析》。 遺憾的是,在1950年12月,瓦爾德因飛機(jī)失事遇難。這位一生研究概率的大師,死在一件概率極低的事情上。 |
|