存在競(jìng)爭(zhēng)風(fēng)險(xiǎn)的情況下,Kaplan-Meier的方法是不準(zhǔn)確的,因?yàn)槲覀儾荒芗俣ㄈ绻S訪時(shí)間足夠長(zhǎng),受試者將會(huì)發(fā)生感興趣的事件。累積發(fā)生率(CIF)是給定事件發(fā)生的子分布,被廣泛應(yīng)用于競(jìng)爭(zhēng)風(fēng)險(xiǎn)分析。 Fine和Gray(1999)提出的分布的比例風(fēng)險(xiǎn)模型旨在擬合感興趣事件的累積發(fā)生率。關(guān)于Fine & Gray 模型,可以參考文獻(xiàn):“A Proportional Hazards Model for the Subdistribution of a Competing Risk. Jason P. Fine and Robert J. Gray,Journal of the American Statistical AssociationVol. 94, No. 446 (Jun., 1999), pp. 496-509”. 研究治療方案A和白血病復(fù)發(fā)的關(guān)系,如果患者在去醫(yī)院復(fù)查的路上出車禍意外死亡了,就觀察不到白血病復(fù)發(fā)了,也就是說“車禍死亡” 和“復(fù)發(fā)”存在競(jìng)爭(zhēng)。這樣的現(xiàn)象在醫(yī)學(xué)研究中,非常常見! 在分析某事件發(fā)生時(shí)間時(shí),如果該事件被其他事件阻礙,即存在競(jìng)爭(zhēng)風(fēng)險(xiǎn)。 例如這篇喝咖啡與低死亡風(fēng)險(xiǎn)的研究。Association of Coffee Consumption With Total and Cause-Specific Mortality Among Nonwhite Populations. Ann Intern Med, 2017. SCI IF=17.1 ![]() 表4的結(jié)果表明排前10位的死因有心臟病、癌癥、慢性下呼吸道疾病、卒中等。根據(jù)趨勢(shì)性檢驗(yàn)(P for trend)的結(jié)果,發(fā)現(xiàn)跟喝咖啡反向關(guān)系顯著的是心臟病、癌癥、慢性下呼吸道疾病、卒中、糖尿病和腎臟病原因?qū)е碌乃劳觥栴}是死亡原因存在競(jìng)爭(zhēng)關(guān)系,因?yàn)橥话l(fā)卒中死亡的人不太可能因?yàn)樽詺⒃偎酪换亍?br> 本研究的作者在統(tǒng)計(jì)方法中寫了:考慮到競(jìng)爭(zhēng)風(fēng)險(xiǎn)后分析咖啡和不同原因死亡的關(guān)系,其中不同的死亡原因被認(rèn)為是不同的事件。 分析結(jié)果表明沒有發(fā)現(xiàn)考慮到死因之間的競(jìng)爭(zhēng)風(fēng)險(xiǎn)影響結(jié)果(P=0.92)。相當(dāng)于敏感性分析:做和不做競(jìng)爭(zhēng)風(fēng)險(xiǎn),得出的兩套結(jié)果對(duì)比一下,如果差異不大表明結(jié)果穩(wěn)定。 如何實(shí)現(xiàn)競(jìng)爭(zhēng)風(fēng)險(xiǎn)模型分析呢?SEER數(shù)據(jù)庫又如何做競(jìng)爭(zhēng)風(fēng)險(xiǎn)模型呢? 首選我們需要從SEER數(shù)據(jù)庫下載癌癥臨床數(shù)據(jù),一般可以使用perl提取,或者直接下載SEER*Stat軟件,在進(jìn)行數(shù)據(jù)下載,當(dāng)然下載數(shù)據(jù)之后,我們需要對(duì)數(shù)據(jù)進(jìn)行清洗,常見的操作包括刪除數(shù)據(jù)未知的條目,如果需要也可以把SEER多原發(fā)的數(shù)據(jù)提取出來,發(fā)生多原發(fā)的條目給刪除。 ![]() 然后找到我們常見的SEER字段,標(biāo)注出來 ![]() 找到死亡原因和生存狀態(tài)兩列,通過這兩列數(shù)據(jù),我們把死亡原因分為三類——生存,死于癌癥,非癌癥死亡,這樣我們就可以做競(jìng)爭(zhēng)風(fēng)險(xiǎn)模型。 接下來用R包做曲線繪制: ![]() 這樣的話,我們就把SEER數(shù)據(jù)庫的競(jìng)爭(zhēng)風(fēng)險(xiǎn)模型構(gòu)建出來了. |
|