一晃晃,又是一周過(guò)去了。作為一個(gè)臨床住院醫(yī),每天起早摸黑,自以為自己很努力,可一到關(guān)鍵時(shí)刻,卻拿不出成果出來(lái),就像大BOSS每次調(diào)侃我們做自我介紹時(shí):我叫某某某,我來(lái)自哪里哪里,然后,就沒(méi)有然后了…… 幸虧自己當(dāng)初加入了《不寫就出局-007》社群,好歹每周還能寫一篇雞湯文章,安慰自己這周我還是有點(diǎn)小成果。 也許有人會(huì)問(wèn),不寫就出局,出局就出局唄,為什么拼命在那里掙扎? 我的回答是這樣的: 因?yàn)槲疫€是有信仰的,信仰我們007這里的人,能堅(jiān)持到最后的,都不是一般人。不知道寫到第七年,我能不能在南極與戰(zhàn)友們相互擊掌擁抱,但這就是我的夢(mèng)想,這幾年,我都會(huì)為此而努力奮斗。 好了,言歸正傳,開始分享這周的學(xué)習(xí)收獲。 本周主要收獲是關(guān)于數(shù)據(jù)處理部分,我將實(shí)操生存分析(Kaplan-Meier生存曲線)、Cox比例風(fēng)險(xiǎn)回歸模型以及Logistic回歸模型。 首先需要下載SPSS軟件,百度或者丁香園一堆鏈接,無(wú)腦下載安裝就可以了。不過(guò)我貌似花了一個(gè)多小時(shí)給我的MBP成功安裝,試了23、25版本安裝不起來(lái),只有24才可以。 安裝好了以后,接下來(lái)我會(huì)舉例統(tǒng)計(jì)學(xué)最常見的三種統(tǒng)計(jì)方法。 實(shí)操一:生存分析 首先我們介紹下什么叫生存分析(survival analysis) 生存分析:是將事件的結(jié)果和出現(xiàn)這一結(jié)果所經(jīng)歷的時(shí)間結(jié)合起來(lái)一類統(tǒng)計(jì)分析方法。不僅考慮事件是否出現(xiàn),而且也考慮事件出現(xiàn)的時(shí)間長(zhǎng)短。 舉例:肺癌腫瘤大小與患者生存時(shí)間的關(guān)系。 1.打開SPSS,導(dǎo)入EXCEL表格,依次:分析-生存分析-Kaplan-Meier; 2.將“survivalmonths”及“tumordeath”分別導(dǎo)入中間的框里,因子就是T_stage;并把比較因子和選項(xiàng)里面能勾的都勾上。 3.生成Kaplan-Meier生存曲線,如下。 從上圖我們可以看出,隨著腫瘤大小越大,患者預(yù)后越差。(備注:這是下載的2014年的肺癌數(shù)據(jù),隨訪時(shí)間只統(tǒng)計(jì)到術(shù)后25個(gè)月。) 實(shí)操二:Cox比例風(fēng)險(xiǎn)回歸模型 前面介紹的是Kaplan-Meier法可以進(jìn)行單個(gè)分組變量的生存分析。那么,為了同時(shí)分析多個(gè)變量對(duì)生存時(shí)間和生存結(jié)局的影響,則需要采用多因素生存分析方法,其中一個(gè)主要的方法就是Cox比例風(fēng)險(xiǎn)回歸模型。 舉例:患者種族、病理分級(jí)、TNM分期與患者生存時(shí)間的關(guān)系。 1.依次:分析-生存分析-Cox回歸; 2.將“survivalmonths”及“tumordeath”分別導(dǎo)入中間的框里,將“grade”、“race”、“Tstage”、“Nstage”、“Mstage”全部納入?yún)f(xié)變量;并將協(xié)變量里的多分類變量進(jìn)行分類排序; 3.結(jié)果如下圖。 上表就是多因素Cox比例風(fēng)險(xiǎn)回歸模型結(jié)果,舉例解讀,T3的患者的死亡風(fēng)險(xiǎn)比T1的患者死亡風(fēng)險(xiǎn)高30%。 ![]() ![]() 實(shí)操三:二元Logistic回歸 Logistic回歸,它是概率型非線性回歸,是研究二分類(可擴(kuò)展到多分類)觀察結(jié)果與一些影響因素關(guān)系的一種多變量分析方法。 舉例:肺癌患者種族、病理分級(jí)、性別等與腫瘤遠(yuǎn)處轉(zhuǎn)移(Mstage)的關(guān)系。 1.依次:分析-回歸-二元Logistic回歸; 2.將二分類變量“Mstage”納入因變量,再將將“gender”、“grade”、“race”、“Tstage”全部納入?yún)f(xié)變量,并將協(xié)變量里的多分類變量進(jìn)行分類排序; 3.結(jié)果如下圖。 上表就是二元Logistic回歸模型結(jié)果,舉例解讀,腫瘤大小影響腫瘤遠(yuǎn)處轉(zhuǎn)移,且T3的患者比T1的患者遠(yuǎn)處轉(zhuǎn)移的風(fēng)險(xiǎn)高14.9倍。 補(bǔ)充鑒別: 多因素Logistic回歸:協(xié)變量大于等于2個(gè),因變量是二分類或者多分類。 多元Logistic回歸:因變量是多分類變量,協(xié)變量任意。 這就是本周關(guān)于數(shù)據(jù)分析的學(xué)習(xí)收獲,對(duì)于SPSS的學(xué)習(xí),我認(rèn)為不僅僅是看視頻操作過(guò)程,同等重要的是理解操作背后的統(tǒng)計(jì)學(xué)原理,這方面我還需要進(jìn)一步學(xué)習(xí)。 毒雞湯:再?gòu)?qiáng)大的對(duì)手,也敵不過(guò)你無(wú)止盡的堅(jiān)持;永遠(yuǎn)不要逃避問(wèn)題,因?yàn)闀r(shí)間不會(huì)給弱者任何回報(bào)。 END |
|