日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

學(xué)院來信493:辛普森悖論-吸煙者存活率比不吸煙者高,可能嗎?

 所來所去 2022-01-06

研究表明:吸煙者的存活率比不吸煙者的存活率要高。

你覺得可能嗎?20年前的一份吸煙者疾病研究報(bào)告確實(shí)得出過這個(gè)結(jié)論:數(shù)據(jù)顯示吸煙者的存活率是76%,不吸煙者的存活率是60%,且吸煙者比不吸煙者的平均壽命要多出20年。The data don't lie. 真的是這樣嗎?

一、辛普森悖論。

辛普森悖論是指:在分組比較中都占優(yōu)勢的一方,在總評中反而變成劣勢的一方。反之亦然。舉個(gè)例子,假設(shè)A醫(yī)生發(fā)現(xiàn)了藥物D。藥物D能降低心臟病的發(fā)病率,研究觀測數(shù)據(jù)如下:

女性(未服藥):心臟病發(fā)作1人,心臟病未發(fā)作19人,發(fā)病率5%;

女性(服藥):心臟病發(fā)作3人,心臟病未發(fā)作37人,發(fā)病率7.5%;

男性(未服藥):心臟病發(fā)作12人,心臟病未發(fā)作28人,發(fā)病率30%;

男性(服藥):心臟病發(fā)作8人,心臟病未發(fā)作12人,發(fā)病率40%;

合計(jì)(未服藥):心臟病發(fā)作13人,心臟病未發(fā)作47人,發(fā)病率21.7%;

合計(jì)(服藥):心臟病發(fā)作11人,心臟病未發(fā)作49人,發(fā)病率18.3%。

研究結(jié)論:

①男性患者,服用了藥物D,心臟病發(fā)作的風(fēng)險(xiǎn)從30%變?yōu)?0%,發(fā)病風(fēng)險(xiǎn)變高了

②女性患者,服用了藥物D,心臟病發(fā)作的風(fēng)險(xiǎn)從5%變?yōu)?.5%,發(fā)病風(fēng)險(xiǎn)同樣變高了。

③匯總數(shù)據(jù),服用了藥物D,心臟病發(fā)作的風(fēng)險(xiǎn)從21.7%變?yōu)?8.3%,整體發(fā)病風(fēng)險(xiǎn)卻變低了

藥物D對男性有害,對女性也有害,但對人類有益,結(jié)果竟如此神奇。

二、問題出在哪里?

問題在于數(shù)據(jù)中包含混雜因子:性別。回顧數(shù)據(jù)可以發(fā)現(xiàn),無論吃藥與否,男性的發(fā)病率遠(yuǎn)高于女性。如果將服藥樣本中的女性數(shù)量增加,整體發(fā)病率自然就會(huì)降低。同理,如果將不吃藥樣本的男性數(shù)量增加,也可以抬高樣本的整體發(fā)病率。

所以,對于藥物D,科學(xué)的計(jì)算方式應(yīng)該是:

①對女性而言,未服藥的發(fā)病率5%;對男性而言,未服藥的發(fā)病率為30%;假設(shè)男女比例為1:1,未服藥群體的平均發(fā)病率為17.5%。

②對女性而言,服藥的發(fā)病率7.5%;對男性而言,服藥的發(fā)病率40%;假設(shè)男女比例為1:1,服藥群體的平均發(fā)病率為23.75%。

結(jié)論:吃了藥物D,群體發(fā)病率從17.5%變?yōu)?3.75%。這藥有毒,不能吃。

三、吸煙者的存活率。

回到文章開篇的問題,為什么會(huì)有這種違背常識(shí)的結(jié)論?

吸煙者的存活率是76%,不吸煙者的存活率是60%,且吸煙者比不吸煙者的平均壽命要多出20年。

問題在于數(shù)據(jù)中包含混雜因子:年齡。我們看不到研究報(bào)告里的底層數(shù)據(jù),但很可能樣本中吸煙者平均年齡比不吸煙者要小。這樣一來,吸煙者的存活率肯定要高,因?yàn)樗麄兏贻p。就好比找100個(gè)20歲的煙民+100個(gè)90歲的不吸煙者來研究,10年后大概率100個(gè)煙民還活著,100個(gè)不吸煙者掛了90個(gè),然后我們得出結(jié)論:不吸煙有害健康。

還記得昨天(學(xué)院來信491)的結(jié)論嗎?我們無形中會(huì)過濾掉部分樣本,比如無趣的渣男。在吸煙者的研究中,當(dāng)然研究人員不會(huì)去故意制造這種極端情況,他們很可能是隨機(jī)從20歲、30歲、40歲、50歲、60歲、70歲、80歲、90歲、100歲...的人群中去選擇研究樣本。但事實(shí)上年紀(jì)越大,吸煙者與不吸煙者的比例就越失調(diào),因?yàn)楹芏嗬蠠熋褚呀?jīng)去世了,從而導(dǎo)致了吸煙者研究對象比不吸煙研究對象更年輕的結(jié)果。

在這個(gè)案例中,我們只有根據(jù)年齡來進(jìn)行數(shù)據(jù)分割,才能得出正確的結(jié)果:吸煙對存活率有負(fù)面影響。

①在20歲群體中,吸煙者的存活率是A%,不吸煙者的存活率是B%,

②在30歲群體中,吸煙者的存活率是C%,不吸煙者的存活率是D%,

......

四、籃球與投資。

知識(shí)需要關(guān)聯(lián)與延展。在我們生活中,還可能發(fā)生哪些類似的事情呢?

比如,籃球。

A和B同學(xué)喜歡打籃球,于是他們各找100個(gè)人單挑。

A找了50個(gè)高手和50個(gè)菜鳥,和高手單挑50場贏了5場,和菜鳥單挑50場贏了25場,總勝率30%。

B找了20個(gè)高手和80個(gè)菜鳥,和高手單挑20場贏了1場,和菜鳥單挑80場贏了32場,總勝率33%。

從勝率上看,B比A勝率高。但從實(shí)力上來看,A比B強(qiáng)得多。

比如,投資。

和高手打球就好比勝率很低,但盈利很大的交易。

和菜鳥打球就好比勝率偏高,但盈利較低的交易。

我們該追求策略勝率,還是整體盈利呢?答案顯然是后者。

吉姆·羅杰斯將其投資經(jīng)驗(yàn)總結(jié)為“40敗3勝”。在其長達(dá)半個(gè)世紀(jì)的投資生涯中,羅杰斯屢屢犯錯(cuò)、屢屢失敗。然而,3勝的分量,遠(yuǎn)超40敗。只要3勝的戰(zhàn)果足夠大,便足以彌補(bǔ)40敗的損失,讓你最終獲得巨大的收益。

“40敗3勝”背后還有一個(gè)需要注意的問題,那就是【風(fēng)險(xiǎn)控制】:因?yàn)榇蠖鄶?shù)人的生命中,屬于你的3勝不大可能連續(xù)出現(xiàn),每次勝利之間可能會(huì)間隔無數(shù)次的失敗,所以我們要做的是將損失控制在最低限度,這樣才可能反敗為勝。說白了,無論是“40敗3勝”還是“80敗1勝”,其關(guān)鍵都是【活下去】,當(dāng)勝利來臨時(shí),我們得確保自己仍然在場。

五、人生的質(zhì)量。

新的一年又到了“樹目標(biāo)、沖業(yè)績”的時(shí)候,我們需要認(rèn)識(shí)到,對于這些目標(biāo)和業(yè)績,“量”與“質(zhì)”是不同的。

“量”更容易測量,比如籃球比賽的勝率、交易的勝率等。

“質(zhì)”則較難衡量,比如籃球?qū)κ值乃?、勝利的盈利情況等。

但社會(huì)大眾總是習(xí)慣以“量”來衡量好壞,卻忽略了生命中的“質(zhì)”才是關(guān)鍵。由此帶來的啟示是:

①如果我們像喜歡找高手單挑的A同學(xué)一樣,選擇了一條相對難走的路,就得做好有可能不被賞識(shí)、不被理解、不被認(rèn)可的準(zhǔn)備,因?yàn)槲覀兊谋憩F(xiàn)(勝率)會(huì)比較難看。

②如果我們是一個(gè)能力有限的球員,要想獲得大眾認(rèn)可,選擇混競爭較小的CBA可能會(huì)比去高手如云的NBA更好,因?yàn)槲覀兊谋憩F(xiàn)(數(shù)據(jù))會(huì)更出彩一些。

六、結(jié)語。

The data don't lie.

數(shù)據(jù)不說謊,但收集數(shù)據(jù)和解讀數(shù)據(jù)的人會(huì)。

所以,相信數(shù)據(jù),但別迷信專家。

祝大家生活愉快。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多