與小伙伴們一起學(xué)習(xí)高分列線圖的優(yōu)點 這一期的這篇高分列線圖在試驗設(shè)計上不同尋常。 頂刊的文章思路應(yīng)該說是值得深入討論的。 這種不同尋常的設(shè)計思路或許能有助于應(yīng)對樣本量不足的情況,當(dāng)然,這樣做是否合適還要以模型預(yù)測效果為依據(jù)。 買個關(guān)子先不說是什么不尋常的設(shè)計,一起往下來看一下吧! DOI: 10.1016/j.ejca.2021.06.024 標(biāo)題有點長: 預(yù)測BRCA 突變且對鉑類敏感的復(fù)發(fā)卵巢癌患者在接受奧拉帕尼(olaparib)維持化療后無進(jìn)展生存期的預(yù)后列線圖 多項臨床試驗表明,在 BRCA 突變和對鉑類敏感的復(fù)發(fā)卵巢癌 (PSROC) 患者對化療有反應(yīng)后,PARPi(poly (ADP-ribose) polymerase inhibitor)維持治療與安慰劑相比在無進(jìn)展生存期(PFS)上具有優(yōu)勢。這也是現(xiàn)在公認(rèn)的治療方案。BRCA 突變患者免于進(jìn)展或死亡的風(fēng)險比 (HR)為 0.23 至 0.35之間。盡管如此,臨床醫(yī)生和患者并不總能意識到 PFS在不同患者間的差異。例如,在 BRCA 突變的 PSROC 患者中,大約三分之一的患者在開始PARPi 維持治療后1 年內(nèi)進(jìn)展,而五分之一的患者會在 5 年后仍可繼續(xù) PARPi治療。對這些患者能從該治療中獲益多久仍難以預(yù)測。通過個體化預(yù)測,列線圖可以幫助臨床醫(yī)生為患者提供咨詢,同時還可以預(yù)測下一步治療的結(jié)果。 FPS在人群中的這種分層現(xiàn)象很有趣,在我們之前分享的一篇研究中也有相關(guān)的討論。【列線圖優(yōu)選】13分+結(jié)直腸癌免疫治療預(yù)測列線圖看看治愈模型是啥? 大多數(shù)預(yù)后不良的晚期癌癥患者,包括卵巢癌,都需要有關(guān)預(yù)后的信息。然而,鑒于患者預(yù)后的異質(zhì)性,這種預(yù)測并不容易。坦率討論預(yù)后有助于改善患者的心理健康。我們之前開發(fā)了兩項整合治療前臨床和實驗室變量的列線圖。這些列線圖可以預(yù)測接受鉑類化療的 PSROC 患者的PFS 和總生存期 (OS)。然而,這些列線圖可能不適用于開始維持 PARPi 治療的BRCA 突變的 PSROC 患者。也缺乏適用這類人群的廣泛使用的預(yù)后工具。 該團(tuán)隊的另外這兩篇文章,一篇預(yù)測PFS,是2011年發(fā)表在Br J Cancer. (IF : 7.6,DOI: 10.1038/bjc.2011.364)另一篇預(yù)測OS,是2013年發(fā)表在Ann Oncol. (IF:32.9,DOI: 10.1093/annonc/mds538)。 真厲害,早年列線圖剛開始應(yīng)用的時候,面對的人群都是大人群,臨床意義大,發(fā)的分?jǐn)?shù)很高。這團(tuán)隊在幾乎十年后接著做的這篇研究就是在一個更小的人群里做了。不過也是隨著研究的發(fā)展,不同時期關(guān)注的病種和人群也在發(fā)生變化。 為了解決這些問題,我們的目標(biāo)是開發(fā)和驗證一項預(yù)后列線圖。該列線圖使用現(xiàn)成的治療前臨床和實驗室數(shù)據(jù)來個性化預(yù)測開始維持 PARPi 治療的 BRCA 突變的 PSROC 女性的治療結(jié)果。我們的目標(biāo)是開發(fā)一種簡單而準(zhǔn)確的預(yù)后工具,以幫助臨床醫(yī)生與患者溝通,并根據(jù)治療的進(jìn)展風(fēng)險對患者進(jìn)行分層。 研究方法 研究人群 19 號研究 (NCT00753545)是一項2 期隨機(jī)試驗,該試驗在有或沒有 BRCA1/2 突變的高級別(2 級或 3 級)漿液性 PSROC 女性中進(jìn)行奧拉帕尼維持治療與安慰劑治療比較。SOLO2/ENGOT-ov21試驗(NCT01874353)是另一項3 期隨機(jī)試驗,該試驗在對化療有反應(yīng)的 BRCA1/2 突變陽性高級別(2 級或 3 級)PSROC 女性中進(jìn)行奧拉帕尼維持治療與安慰劑治療比較?;颊弑环峙渲翃W拉帕尼組(19號研究的膠囊為 400 毫克,SOLO2/ENGOT-ov21研究的片劑為 300 毫克,每日兩次)或安慰劑組,直至出現(xiàn) RECIST 定義的疾病進(jìn)展或不可接受的毒性反應(yīng)?;颊呖梢岳^續(xù)接受治療直至研究人員認(rèn)為患者不再從治療中受益。兩項試驗均顯示出顯著的 PFS 改善(HR 0.35,95% CI 0.25-0.49,P<0.001;HR 0.30,95% CI 0.22-41,P<0.0001)。之前的文章已經(jīng)報道了完整的細(xì)節(jié)。 根據(jù)定義,預(yù)后因素可以在不管治療如何的情況下預(yù)測結(jié)局,并且在未接受治療的患者中更能確定預(yù)后因素[14]。由于19號試驗和 SOLO2/ENGOT-Ov21 試驗都是隨機(jī)對照試驗,預(yù)后因素在化療組和安慰劑組之間平均分布。因此,本列線圖以 146 名接受安慰劑治療的 BRCA 突變陽性 PSROC 患者作為訓(xùn)練集(60 名參加了19號試驗,86 名參加了 SOLO2/ENGOT-Ov21試驗)。251 名使用奧拉帕尼治療的患者的獨立隊列作為驗證集驗證了我們的模型(19號試驗中的 68 名和SOLO2/ENGOT-Ov21試驗中的183名)。驗證集與訓(xùn)練集之間具有相似的特征。這樣的試驗設(shè)計使我們能夠觀察自然病程(訓(xùn)練集隊列)并評估使用奧拉帕尼時疾病軌跡的變化(驗證集隊列)。 [14] Coate LE, John T, Tsao MS, Shepherd FA. Molecular predictive and prognostic markers in non-small-cell lung cancer. Lancet Oncol. 2009 Oct;10(10):1001-10. doi: 10.1016/S1470-2045(09)70155-X. PMID: 19796752. 這里的試驗設(shè)計比較不同尋常。一般來說,預(yù)測什么人群,就用什么人群作為訓(xùn)練集建模。該研究預(yù)測維持化療的患者的FPS,那比較自然的想法是使用維持化療的患者人群建立模型。驗證集也應(yīng)該是維持化療的患者人群。 但是該研究在這里的設(shè)計使用安慰劑人群進(jìn)行建模。其原因是認(rèn)為安慰劑人群更有利于發(fā)現(xiàn)影響因素。“安慰劑人群更有利于發(fā)現(xiàn)影響因素”這個觀點的引文是柳葉刀的大文章,那先當(dāng)他是對的。但是建模的過程中除了要找到危險因素,還需要確定危險因素對應(yīng)的統(tǒng)計量OR值,基于OR值才能建立模型。那么安慰劑人群和治療人群的影響因素的OR值一樣嗎?這個統(tǒng)計學(xué)問題已經(jīng)在我的知識盲區(qū)了。 而評價模型做得對不對應(yīng)該從模型的預(yù)測效果上去評價。預(yù)測效果好就行。那么這篇文章以這種不尋常的設(shè)計得到的列線圖效果預(yù)測如何呢?我們接著往下看。 統(tǒng)計方法 主要研究終點是PFS(19號試驗以 RECIST 標(biāo)準(zhǔn) 1.0 版;SOLO2/ENGOT-ov21試驗以改良 RECIST 標(biāo)準(zhǔn)的 1.1 版)。選擇了 13 個變量作為臨床相關(guān)的預(yù)后因素,并在訓(xùn)練集隊列中進(jìn)行單因素分析。這些變量包括:BRCA 突變、腫瘤分級、FIGO 分期、無鉑間隔(patinum-free interval)、對上一次鉑類治療的反應(yīng)、基線 ECOG 表現(xiàn)狀態(tài)、先前鉑線(platinum lines)的數(shù)量、最大病灶是否大于1 cm,和基線的查血指標(biāo),包括 CA-125、白蛋白、淋巴細(xì)胞、中性粒細(xì)胞和中性粒細(xì)胞-淋巴細(xì)胞比值。多因素 Cox 比例風(fēng)險分析時使用向后逐步法篩選變量,包括從單因素分析中確定的P 值小于0.20的變量。只有 P<0.05 的變量被保留在最終的多因素模型中。考慮到臨床適用性,我們使用最小 P 值截點方法(minimal P-value cut-point approach)將CA-125 進(jìn)行重編碼為二分類變量,截斷點四舍五入到最接近的5。 通過使用模型中的系數(shù),為每個預(yù)測指標(biāo)分配點來生成列線圖,以便可視化估計個體預(yù)測結(jié)果。這些點反映了每個預(yù)測指標(biāo)在最終預(yù)測模型中的相對貢獻(xiàn)。將每個患者的這些分?jǐn)?shù)相加,總分(范圍從 0 到 100)代表加權(quán)總和。通過使用列線圖,繪制從總分軸到預(yù)測結(jié)果軸的垂直線,獲得估計的中位 PFS 和 12 個月PFS 的概率。根據(jù) PFS 的預(yù)測概率將患者按四分位數(shù)進(jìn)行分組。第一個四分位數(shù)是良好預(yù)后組(0-25%),中間兩個四分位數(shù)是中等預(yù)后組(26-75%),最后四分位數(shù)是不良預(yù)后組(76-100%)。 我們從兩個角度對該列線圖進(jìn)行評估。首先,為了確定區(qū)分能力,我們在訓(xùn)練集中計算 Harrell 的區(qū)分一致性指數(shù)統(tǒng)計量 (C-index)。這個過程中使用1000次重復(fù)的boot-strap內(nèi)部驗證方法來估計校正的 C -index ,并將其與驗證集隊列的C -index進(jìn)行比較。 這里使用的boot-strap內(nèi)部驗證的方法,在我們之前的教程中有提供進(jìn)行l(wèi)ogistic回歸時三種不同內(nèi)部驗證方法的一鍵實現(xiàn)代碼。而cox的內(nèi)部驗證代碼還沒搞出來,小伙伴們多轉(zhuǎn)發(fā)我們的推送,我們爭取下周搞一個。 C 指數(shù)的計算方法是:患者的所有兩兩成對組合總數(shù)作為分母,對子中預(yù)測 PFS 較長的患者也是實際活得更長的患者的對子數(shù)作為分子。C指數(shù)取值范圍為 0.5 到 1.0,其中 0.5 表示完全隨機(jī)預(yù)測,1.0 表示區(qū)分能力完美的模型。我們還繪制了 Kaplane-Meier 生存曲線并使用對數(shù)秩檢驗(log-rank test)來說明訓(xùn)練集隊列和驗證集隊列中,列線圖預(yù)測得到的患者分類的區(qū)分效果。其次,通過直觀比較列線圖預(yù)測的 PFS 在 6、12 和 18 個月的概率與每個預(yù)后組的實際觀察到的 PFS 概率的匹配程度來評估校準(zhǔn)度。接近 45 度線的校準(zhǔn)圖表明列線圖的校準(zhǔn)度良好。我們評估了每項研究中患者在不同風(fēng)險組中的治療獲益,并提供了 PFS 的 HRs 和95% CI。19號試驗 和 SOLO-2/ENGOT-ov21試驗的研究指導(dǎo)委員會批準(zhǔn)了這項研究。 研究結(jié)果 表1展示了訓(xùn)練集和驗證集間基線數(shù)據(jù)的差異??梢钥闯鲇?xùn)練集和驗證集之間在基線數(shù)據(jù)上沒有差異。 這個表比較好的一點是在表注中寫出了變量缺失值的情況,這種形式很清楚地展示了缺失值情況,值得借鑒。 圖1展示了訓(xùn)練集和驗證集PFS的差異。由于兩組一組安慰劑,一組化療,有差異也是意料之中的,圖1和表1僅僅是展示訓(xùn)練集和驗證集間的異同。 表2展示訓(xùn)練集中單因素Cox回歸分析的結(jié)果。表中的outcome指的就是進(jìn)展/死亡事件。該研究將P值小于0.2的變量都納入了后續(xù)多因素分析中。 表3展示多因素分析的結(jié)果。最終的多因素模型中包括了4個變量。 圖2中展示基于多因素模型中4個變量構(gòu)建的列線圖模型。 我們直接使用這個列線圖的話,需要做垂直線,得到每一項對應(yīng)第一行Points行的得分。全部相加后總得分在Total Points 行做垂直線,與最后預(yù)測結(jié)果行相交處的數(shù)值即為預(yù)測的結(jié)果。 接下來評估模型表現(xiàn)。這一步我們看看預(yù)測效果怎么樣,能不能支持上面獨特的研究設(shè)計。 首先用C指數(shù)評價區(qū)分度。訓(xùn)練集中C-index=0.63,boot-strap校正后的C-index=0.64。比較一般。驗證集中C-index=0.71。比較有趣,一般來說驗證集的預(yù)測效果會比訓(xùn)練集的預(yù)測效果差。這里驗證集的訓(xùn)練效果還更好一些。 圖3展示了基于列線圖預(yù)測結(jié)果的概率值,根據(jù)四分位數(shù)對人群進(jìn)行危險程度分層,分出三層。然后比較三層之間是否存在預(yù)后差異,如果存在則說明該列線圖能區(qū)分出危險與不危險的人群。圖3中的結(jié)果看來是區(qū)分出來了。 圖4展示了驗證集中6個月、12個月、18個月的校準(zhǔn)圖??梢钥吹叫?zhǔn)曲線和對角線匹配重合情況較好,且校準(zhǔn)曲線的可信區(qū)間不大,說明校準(zhǔn)度良好。 比較可惜的是該研究沒有增加決策曲線分析(DCA)評價使用模型的臨床獲益。 該研究將模型做成在線網(wǎng)站,可以交互式使用,十分方便。不過他這個網(wǎng)站是做在自己學(xué)校的服務(wù)器上。我們之前的推送介紹過如何用shiny這個公共的網(wǎng)站方便地建立自己的在線動態(tài)列線圖。感興趣的小伙伴可以看一下。【列線圖教程】制作在線交互式 動態(tài)列線圖 網(wǎng)頁 總的來說,該研究本身的預(yù)測效果尚可,因此也支持了這個研究使用這樣的研究設(shè)計。但是小伙伴們自己的研究能不能也這樣搞呢?還是要看小伙伴自己的數(shù)據(jù)做出來的預(yù)測效果怎么樣啦!效果為王。 這里多提一下,多因素分析和列線圖模型的關(guān)系。兩者實際上是不一樣的。 多因素分析的目的是討論變量間的關(guān)系,尋找影響因素。 而列線圖模型的目的是獲得更好的預(yù)測效果,如果納入的變量能提高模型表現(xiàn),那哪怕這個變量不是獨立影響因素也無妨。 兩者的分析過程有各自的評價指標(biāo)和方法。比如多因素分析時候討論混雜因素、交互作用等;列線圖構(gòu)建時對訓(xùn)練集和驗證集評價區(qū)分度、校準(zhǔn)度等。 只是很多時候,直接拿多因素分析發(fā)現(xiàn)的獨立影響因素進(jìn)行列線圖建模就能獲得較好的預(yù)測表現(xiàn),且這種方式建模較容易對模型進(jìn)行解釋(可解釋性較好)。因此很多研究直接用多因素分析發(fā)現(xiàn)的獨立影響因素進(jìn)行列線圖建模。 小伙伴們用常規(guī)方法進(jìn)行分析也能獲得不錯的列線圖模型,很多時候也足以發(fā)文章。但是想進(jìn)一步提升模型表現(xiàn),或是有更細(xì)致的問題要研究,或是研究的是大課題,巨重要,那還是得深入琢磨、請教統(tǒng)計學(xué)老師啦。 另外公眾號為方便小伙伴們交流列線圖開展心得,開了第一個微信群,歡迎感興趣的小伙伴進(jìn)群交流!純學(xué)術(shù),無套路! |
|