日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

新鮮出爐的lancet-oncology(IF:51)預(yù)測模型文章:列線圖預(yù)測黑色素瘤患者的預(yù)后(含全部代碼)

 阿越就是我 2024-06-26 發(fā)布于上海

??專注R語言在??生物醫(yī)學(xué)中的使用


設(shè)為“星標(biāo)”,精彩不錯過


今天給大家介紹一篇新鮮出爐的lancet oncology中的臨床預(yù)測模型文章,2024年4月份剛發(fā)表的。

開發(fā)和驗證預(yù)測黑色素瘤患者前哨淋巴結(jié)活檢后無復(fù)發(fā)生存黑色素瘤特異性生存的新模型:一項國際性、回顧性、多中心分析

全文只有4個表+2張圖(其中一張還是流程圖),方法介紹部分十分詳細(xì),并且給了代碼,非常值得學(xué)習(xí)。下面給大家簡單介紹下。

背景

對高危黑色素瘤患者進(jìn)行輔助全身治療需要準(zhǔn)確的疾病分期。然而,根據(jù)美國癌癥聯(lián)合委員會(第8版)的定義,不同疾病階段的結(jié)果存在不一致。

作者覺得原來的分類方法太過寬泛,同一組內(nèi)的患者病情差異很大,所以開發(fā)了新的模型,可以對每個患者做出針對性的預(yù)測,而不是根據(jù)疾病階段對患者進(jìn)行分組。

該模型可以支持哪些患者可以放棄輔助治療的臨床決策,因為它能夠準(zhǔn)確識別復(fù)發(fā)和死亡風(fēng)險增加的患者。

方法

入選

開發(fā)集(也就是訓(xùn)練集)由4個歐洲黑色素瘤中心的數(shù)據(jù)構(gòu)成,一共4123人;外部驗證集由澳大利亞的中心構(gòu)成,一共4822人。超大的隊列,從1997年到2013年!

image-20240616213822378
image-20240612210724199

入選標(biāo)準(zhǔn)非常詳細(xì),不同的指南不同的診斷標(biāo)準(zhǔn)如何統(tǒng)一的都有詳細(xì)的說明。

建模過程

我這里介紹一些關(guān)鍵的地方,細(xì)節(jié)的地方大家感興趣自己閱讀原文。

  • 最開始選擇10個變量,建立的是cox回歸模型。
  • mice包多重插補(bǔ)缺失值,
  • 建模時包括了每個變量和sentinel-node-status這個變量的交互項
  • 進(jìn)行了等比例風(fēng)險檢驗,使用的是schoenfeld殘差法;
  • 對連續(xù)型變量使用了限制性立方樣條轉(zhuǎn)換,對不符合正態(tài)分布的連續(xù)型變量使用log轉(zhuǎn)換;
  • 向后法篩選變量,最終剩下6個變量,通過偏logloss計算變量重要性;
  • 建模時使用了leave-one-center-out的重抽樣方法,類似于交叉驗證,但是和交叉驗證不完全一樣,非常巧妙,每次使用3個中心的數(shù)據(jù)建模,用1個中心的數(shù)據(jù)驗證;
  • 為了避免高估事件發(fā)生率,直接在99%分位數(shù)截斷了風(fēng)險得分;
  • 結(jié)果報告根據(jù)TRIPOD指南書寫。

我覺得最牛逼的是,作者開發(fā)了一個模型,但是可以計算兩種分?jǐn)?shù):melanoma-specific mortality 和 recurrence-free survival

結(jié)果

第一個結(jié)果就是基線資料表,介紹開發(fā)集和外部驗證集的10個變量的情況。

第二個表展示開發(fā)集和外部驗證集的復(fù)發(fā)和死亡率,以及K-M法估計的5年生存率,并且根據(jù)前哨淋巴結(jié)陰性/陽性進(jìn)行分組展示。

第三個結(jié)果是最終得到的6個變量的HR值和變量重要性,這幾個變量有些是由交互項得來的,有些是多個指標(biāo)計算出來的,并不是原始的變量,作者在文章中有詳細(xì)介紹:

第四個結(jié)果是模型的區(qū)分度情況,作者選取的時間點是5年,這是為了和世界公認(rèn)的標(biāo)準(zhǔn)保持一致。主要使用的指標(biāo)是以下4個:

最后一個結(jié)果是模型的可視化以及模型預(yù)測的5年風(fēng)險曲線和列線圖得分頻率分布:

這個列線圖沒什么好說的,就是使用rms畫出來的,后期又進(jìn)行了一點處理。

下面這個風(fēng)險曲線就很牛逼了,下次我們一起學(xué)習(xí)下這個圖的畫法,它展示的信息量非常大。

作為全文唯一的圖,首先它是一個雙y軸圖,說實話這是很少見的,因為有部分專家學(xué)者認(rèn)為雙y軸圖會使得信息展示容易混淆,不方便理解。

這個圖的橫坐標(biāo)是列線圖計算出來的分?jǐn)?shù),左側(cè)的y軸是模型預(yù)測的5年風(fēng)險,圖中的兩條線要和左側(cè)的y軸一起看,紅色線是黑色素瘤特異性死亡風(fēng)險,藍(lán)色線是復(fù)發(fā)或死亡風(fēng)險,剛好是模型預(yù)測的兩種概率(文中對每一個名詞也都有詳細(xì)的解釋)。

然后直方圖是列線圖分?jǐn)?shù)的頻率分布,要和右側(cè)的y軸一起看,并且根據(jù)前哨淋巴結(jié)的狀態(tài)(陰性/陽性)使用了不同的顏色。可以看到淋巴結(jié)陽性的分?jǐn)?shù)很明顯是高于淋巴結(jié)陰性的,他們的死亡和復(fù)發(fā)風(fēng)險也都是更高的。

除此之外,對于常見的校準(zhǔn)曲線決策曲線這些東西,作者也都做了,只是沒放在正文里而已。

作者最后開發(fā)了一個網(wǎng)頁計算器,可以計算5年的無復(fù)發(fā)生存和疾病特異性生存,網(wǎng)址是:https://erasmusmcpublichealth./MelanomaWebapp/,但是作者還搞了個聲明,告訴你這東西不能用于醫(yī)療決策,只能用作演示和教學(xué)。。

image-20240616212904759

借鑒學(xué)習(xí)

  1. 數(shù)據(jù)的納入情況寫的非常詳細(xì),由于納入了從1997年到2013年共5個中心(4個中心的數(shù)據(jù)做開發(fā)集,澳大利亞的一個單獨的中心做外部驗證集)的數(shù)據(jù),連指南的診斷標(biāo)準(zhǔn)都變了!文中詳細(xì)介紹了各種情況的處理,對做多中心、大型隊列數(shù)據(jù)的朋友很有參考價值。
  2. 對各個變量的處理、重編碼、變量轉(zhuǎn)換、缺失值插補(bǔ)等都有詳細(xì)的介紹,每個變量是否正態(tài)分布,是否符合線性,是否進(jìn)行了RCS轉(zhuǎn)換或者log轉(zhuǎn)換等,都有詳細(xì)的說明。就光方法介紹的這個詳細(xì)程度,說實話我沒見過這么詳細(xì)的,一看就不是常規(guī)的套路文能比的。
  3. 一個模型可以計算2種概率,同時預(yù)測兩種預(yù)后!根據(jù)作者給的代碼來看,應(yīng)該也是建立了2個模型,但是最后結(jié)果是兩個模型納入的自變量完全一致,代碼還沒細(xì)看,下次詳細(xì)研究。
  4. 直接給代碼了,就在github:https://github.com/CHMMaas/PaperMelanoma。但是沒給數(shù)據(jù),你可以問作者要,但是作者不一定給。
  5. 主要使用的包是rms,真的強(qiáng),畢竟這個包的作者是生物統(tǒng)計教授Frank E Harrell,目前還在世的,還經(jīng)常在他的論壇上回答問題。里面用到的還有很多函數(shù)我都沒了解過,必須好好學(xué)習(xí)一番。

聯(lián)系我們,關(guān)注我們

  1. 免費QQ交流群1:613637742
  2. 免費QQ交流群2:608720452
  3. 公眾號消息界面關(guān)于作者獲取聯(lián)系方式
  4. 知乎、CSDN、簡書同名賬號
  5. 嗶哩嗶哩:阿越就是我

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多