日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

【每日一書】0440.《赤裸裸的統(tǒng)計(jì)學(xué)》

 長(zhǎng)沙7喜 2020-03-14
0440.《赤裸裸的統(tǒng)計(jì)學(xué)》 來自東方極致 00:00 25:11

《赤裸裸的統(tǒng)計(jì)學(xué)》| 寒石解讀 

關(guān)于作者

查爾斯·惠倫,美國(guó)達(dá)特茅斯大學(xué)教授,1997 到 2002 年間擔(dān)任《經(jīng)濟(jì)學(xué)人》雜志駐美國(guó)中西部地區(qū)記者。主要從事經(jīng)濟(jì)學(xué)研究,曾在《芝加哥郵報(bào)》《紐約時(shí)報(bào)》和《華爾街日?qǐng)?bào)》發(fā)表過多篇文章,所著《赤裸裸的經(jīng)濟(jì)學(xué)》是暢銷多年的經(jīng)濟(jì)學(xué)普及讀物。

關(guān)于本書

這是一本關(guān)于統(tǒng)計(jì)學(xué)常識(shí)的科普書,作者從理財(cái)投資、民意調(diào)查、醫(yī)療健康、刑事判決等生活案例中剝繭抽絲,向我們展示了妙趣橫生的統(tǒng)計(jì)學(xué)規(guī)律。

核心內(nèi)容

本書作者認(rèn)為,作為大數(shù)據(jù)時(shí)代炙手可熱的學(xué)問,統(tǒng)計(jì)學(xué)可以解決很多實(shí)際問題??扇绻\(yùn)用不當(dāng),統(tǒng)計(jì)學(xué)也會(huì)制造假象、造成誤導(dǎo)。因此,我們很有必要掌握一些統(tǒng)計(jì)學(xué)中的概念和原理,它們并不艱澀難懂,卻能幫我們讀懂真相,預(yù)測(cè)未來。核心內(nèi)容包含五個(gè)部分:1、大數(shù)定律;2、中心極限定理;3、隨機(jī)抽樣;4、回歸分析;5、常犯的概率學(xué)錯(cuò)誤。


一、大數(shù)定律

相同條件下,當(dāng)隨機(jī)試驗(yàn)次數(shù)足夠多時(shí),實(shí)驗(yàn)結(jié)果的平均值會(huì)無限接近 “期望值”。

1.  我們可以通過研究概率,明智地選擇投資理財(cái)方式

【案例】

就算是某期彩票爆出大獎(jiǎng)掏空了獎(jiǎng)池,從長(zhǎng)遠(yuǎn)看,發(fā)行彩票也是穩(wěn)賺不賠。根據(jù)“大數(shù)定律”,發(fā)行機(jī)構(gòu)只要保證彩票的銷售額大于獎(jiǎng)金期望值,就肯定賺錢,所以沉溺于博彩是非常不理智的。

對(duì)于投資門檻高、風(fēng)險(xiǎn)大,但是回報(bào)很高的項(xiàng)目,如果把注意力都放在高回報(bào)率上很危險(xiǎn)。大數(shù)定律成立的前提是“試驗(yàn)次數(shù)足夠多”,如果你沒有承擔(dān)多次投資失敗的資本,孤注一擲的投資很可能會(huì)血本無歸。

2. 幫助我們理性面對(duì)風(fēng)險(xiǎn)

【案例】

對(duì)小額電子產(chǎn)品推出的付費(fèi)延保服務(wù),商家肯定穩(wěn)賺不賠,用戶選擇付費(fèi)延?;旧系扔诶速M(fèi)錢。但對(duì)于那些大額度人身、財(cái)產(chǎn)意外險(xiǎn),它們更多的是一個(gè)規(guī)避風(fēng)險(xiǎn)的理性工具,幫你在遭受一些難以承受的巨大損失時(shí)渡過難關(guān)。雖然保險(xiǎn)公司賺取了巨大的利潤(rùn),這種錢我們還必須得花。
二、中心極限定理

依據(jù)該定理,我們對(duì)一個(gè)基數(shù)龐大的群體做統(tǒng)計(jì)調(diào)查時(shí),只要對(duì)其中的一部分樣本進(jìn)行研究,得出的結(jié)論就能反映整個(gè)群體的特點(diǎn)。

1. 如果掌握了某個(gè)群體的具體信息,就能推理出從這個(gè)群體中正確抽取隨機(jī)樣本的情況。

【案例】

一個(gè)城市同時(shí)在舉辦馬拉松比賽和吃熱狗大賽,比賽前有一輛載滿外國(guó)馬拉松運(yùn)動(dòng)員的公交車失蹤了,結(jié)果警察找到了一輛載滿大胖子外國(guó)人的公交車。由于語言不通,警察只能根據(jù)經(jīng)驗(yàn)判斷:即使馬拉松選手里面可能也有一兩個(gè)略重的,但是滿車都是胖子不大可能,因此很可能找錯(cuò)了車。

2. 如果已知兩個(gè)樣本的基本特性,就能推理出這兩個(gè)樣本是不是來自同一個(gè)群體。

【案例】

上述案例中如果找到兩輛車,乘客各自有胖有瘦,該怎么判斷?這時(shí)候可以測(cè)量乘客體重,計(jì)算體重分布的標(biāo)準(zhǔn)差。根據(jù)中心極限定理,馬拉松運(yùn)動(dòng)員群體的體重標(biāo)準(zhǔn)差是明顯小于普通群體的,他們的體重分布更加集中于平均值周圍。由此仍然可以判斷出哪輛車是我們要找的。

三、隨機(jī)抽樣

這是收集數(shù)據(jù)的主要方法,核心是必須保證每個(gè)對(duì)象被抽到的概率完全相等。但大部分調(diào)查的對(duì)象是人群,人口組成非常復(fù)雜。如果不能保證等概率抽樣,抽樣數(shù)據(jù)就會(huì)存在“偏見”,就會(huì)得出錯(cuò)誤結(jié)論。

1. 選擇性偏見:樣本選擇帶有潛在傾向性時(shí)就會(huì)出現(xiàn)。

【案例】

1936年美國(guó)總統(tǒng)大選時(shí),《文學(xué)文摘》雜志面向訂閱者開展的民意測(cè)驗(yàn),是史上知名度最高的統(tǒng)計(jì)錯(cuò)誤。雜志編輯沒有意識(shí)到,訂閱這本雜志的人平均來說要比普通美國(guó)民眾更富有,他們更傾向于投票給保護(hù)富人利益的共和黨。這樣帶有選擇性偏見的樣本即使容量很大,也無法正確反映民意。

2. 幸存者偏見:如果樣本中有數(shù)據(jù)缺失,會(huì)導(dǎo)致樣本組成發(fā)生改變。

【案例】

很多投資基金公司會(huì)同時(shí)開放20只新基金,經(jīng)過三年的經(jīng)營(yíng),總會(huì)有2到3只基金連續(xù)三年“跑贏”標(biāo)準(zhǔn)普爾指數(shù)。公司只要把十幾只失敗的基金悄悄關(guān)閉,大肆宣傳這兩三只“幸存者”,就可以把投資者的錢騙進(jìn)來了。而實(shí)際上,這些“幸存”基金接下來的表現(xiàn)會(huì)逐漸回歸平均水平。

3. 健康用戶偏見:用來比對(duì)的樣本其實(shí)選擇在了不同群體當(dāng)中。

【案例】

假設(shè)衛(wèi)生部門發(fā)現(xiàn),哈佛大學(xué)新生中有98%的人在少年時(shí)期穿紫色睡衣,而監(jiān)獄里的犯人中只有3%的人這樣做過。因此得出了一個(gè)結(jié)論:穿紫色睡衣的孩子確實(shí)更有可能取得成功。這很顯然是很荒謬的結(jié)論,這個(gè)問題在于我們用來對(duì)比的兩組人根本就是兩類人。真正對(duì)孩子大腦發(fā)育起作用的,是給孩子穿上紫色睡衣的家長(zhǎng),他們更注重對(duì)孩子的家庭教育。

四、回歸分析

1. 對(duì)那些錯(cuò)綜復(fù)雜的問題,回歸分析可以通過建模計(jì)算,從已知現(xiàn)象中還原未知原因,甚至可以計(jì)算每種原因?qū)Y(jié)果的貢獻(xiàn)比例。

【案例】

醫(yī)學(xué)家發(fā)現(xiàn),級(jí)別較低的公務(wù)員更容易患上心臟病?!鞍讖d”研究項(xiàng)目組經(jīng)過長(zhǎng)時(shí)間縱向數(shù)據(jù)采集,比對(duì)了可能導(dǎo)致心臟病的一系列原因,包括低階公務(wù)員的學(xué)歷普遍偏低、煙民比例高、醫(yī)療服務(wù)差、加班多、鍛煉少等等。面對(duì)這些錯(cuò)綜復(fù)雜的變量,統(tǒng)計(jì)學(xué)家建立回歸方程,計(jì)算了各個(gè)變量和心臟病發(fā)病率的線性關(guān)系?;貧w分析表明,造成心臟病高發(fā)的真正原因,是對(duì)工作缺乏控制力和話語權(quán)。而這類存在感較低的崗位,在低級(jí)別職位中更常見。

2. 電腦永遠(yuǎn)不能代替人的工作,如果在進(jìn)行回歸分析時(shí)遺漏了變量,就會(huì)得出危險(xiǎn)的結(jié)論。

【案例】

上世紀(jì)90年代,哈佛大學(xué)醫(yī)學(xué)院對(duì)12萬名女性開展縱向調(diào)查,經(jīng)回歸分析顯示,定期攝入雌激素可以減少女性心臟病發(fā)病率,隨后醫(yī)院開始提供雌激素的補(bǔ)充治療。而后來的臨床試驗(yàn)發(fā)現(xiàn),此舉會(huì)導(dǎo)致乳腺癌和血栓病高發(fā),因此死亡的女性患者可能達(dá)到上萬人。

五、常犯的概率學(xué)錯(cuò)誤

1. “黑天鵝”事件:忽視小概率事件,有時(shí)會(huì)造成嚴(yán)重的后果。

【案例】

2008年美國(guó)次貸危機(jī)爆發(fā)前,整個(gè)北美金融行業(yè)都在使用同一個(gè)風(fēng)險(xiǎn)價(jià)值模型來預(yù)測(cè)投資風(fēng)險(xiǎn)。這個(gè)模型的強(qiáng)大之處在于它非常精確,可以預(yù)測(cè)99%的市場(chǎng)風(fēng)險(xiǎn)。然而,該模型是根據(jù)過去20年的市場(chǎng)行為建立的,不能對(duì)剩余1%的意外情況做出預(yù)測(cè)??墒牵S著2007年美國(guó)商業(yè)銀行房貸業(yè)務(wù)的崩潰,“黑天鵝”真的出現(xiàn)了,整個(gè)華爾街措手不及,一次全球大范圍的金融危機(jī)因此爆發(fā)。

2. “檢方謬誤”:通過統(tǒng)計(jì)數(shù)據(jù)推斷出的結(jié)論,必定存在誤差,不會(huì)100%正確。即使誤差再小,也不能忽視它的存在。

【案例】

假設(shè)一名法官被告知:犯罪現(xiàn)場(chǎng)遺留的 DNA 樣本和被告的 DNA 相吻合,除了被告以外,這個(gè)樣本和其他人 DNA 相吻合的概率只有百萬分之一。如果僅憑這些證據(jù)為被告人定罪,就可能出現(xiàn)冤案。百萬分之一的誤差看似很小,但警方的 DNA 樣本庫數(shù)量非常龐大,通過樣本比對(duì),找到兩個(gè) DNA 特征相似的人并非不可能。

金句

1. 對(duì)于長(zhǎng)期發(fā)行、銷量穩(wěn)定的彩票,獎(jiǎng)金總額的期望值是恒定的,發(fā)行機(jī)構(gòu)只要保證彩票的銷售額大于獎(jiǎng)金期望值,就肯定能賺錢。

2. 我們不可能通過數(shù)據(jù)得出完全確鑿的真相,只能通過合理控制誤差來無限接近真相。

3. 最大的風(fēng)險(xiǎn)從來就不是那些我們能看得見、算得出的,而是那些看上去似乎概率很小,我們認(rèn)為一輩子都不可能發(fā)生的風(fēng)險(xiǎn)。它們的確會(huì)發(fā)生,而且比我們想象的要頻繁得多。

4. 統(tǒng)計(jì)學(xué)原理雖然看似簡(jiǎn)單,但卻不是人人都能做數(shù)據(jù)分析師。因?yàn)樗饶芙o我們的觀點(diǎn)找到嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)支持,但有時(shí)也會(huì)給一個(gè)錯(cuò)誤的結(jié)論,披上合理的外衣。

撰稿:寒石
腦圖:摩西
轉(zhuǎn)述:于浩

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多