"如何分析真實(shí)世界研究數(shù)據(jù)"系列(13) 真實(shí)世界研究最大的挑戰(zhàn)是研究遇到混雜偏倚的強(qiáng)力挑戰(zhàn),無(wú)論哪個(gè)項(xiàng)目必須直面混雜因素、控制混雜偏倚、實(shí)現(xiàn)真實(shí)推斷因果關(guān)系。關(guān)于混雜因素與混雜偏倚的概念也是分析真實(shí)世界研究數(shù)據(jù)必須掌握的知識(shí)點(diǎn)。本文做詳細(xì)系統(tǒng)地論述。 統(tǒng)計(jì)學(xué)為流行病學(xué)服務(wù),包括臨床流行病學(xué)、公共衛(wèi)生的流行病學(xué)、甚至包括基礎(chǔ)的動(dòng)物研究,其目標(biāo)是推斷研究因素(暴露因素、處理因素或臨床治療因素)與結(jié)局(是否死亡、有效、發(fā)?。┑恼鎸?shí)關(guān)系,并基于理論探討兩者是否存在著因果關(guān)系。 整個(gè)統(tǒng)計(jì)學(xué)過(guò)程,必須接受一系列考驗(yàn),去偽存真,最終得到真相。上述主要包括排除機(jī)遇關(guān)聯(lián)、排除虛假關(guān)聯(lián)、排除非因果關(guān)聯(lián)等三個(gè)方面,除了一點(diǎn)(排除機(jī)遇關(guān)聯(lián))之外,其他都有流行病學(xué)的偏倚有關(guān),而統(tǒng)計(jì)學(xué)在其中發(fā)揮重要作用的是混雜偏倚。 醫(yī)學(xué)研究是抽樣研究,據(jù)樣本推斷總體,獲得總體上研究因素與結(jié)局的關(guān)系。但是整個(gè)推斷過(guò)程中會(huì)由于各種原因?qū)е隆翱傮w上研究因素與結(jié)局的關(guān)系”的失真,這一失真現(xiàn)象,稱之為偏倚。 諸位,特別是理科生,應(yīng)該都學(xué)習(xí)過(guò)誤差的概念。誤差包括隨機(jī)誤差和系統(tǒng)誤差。隨機(jī)誤差是由于個(gè)體變異、抽樣或者不可知原因造成的隨機(jī)性的誤差,是無(wú)法杜絕的。而系統(tǒng)誤差是人為或者測(cè)量方法引起方向性的錯(cuò)誤,是可以控制甚至是杜絕的。 偏倚就是一類系統(tǒng)誤差,是導(dǎo)致結(jié)果失真的錯(cuò)誤,它是醫(yī)學(xué)研究普遍存在,但必須想辦法遏制在最低水平的一類錯(cuò)誤。 它包括選擇偏倚、信息偏倚與混雜偏倚三類 選擇偏倚 由于選入的研究對(duì)象與未選入的研究對(duì)象在某些特征上存在差異而引起的誤差。常發(fā)生在設(shè)計(jì)階段。 信息偏倚 又稱測(cè)量偏倚、觀察偏倚。是在收集信息過(guò)程中由于測(cè)量暴露與結(jié)局的方法有缺陷,使采集到的信息不準(zhǔn)確,從而引起偏倚。錯(cuò)分是測(cè)量不準(zhǔn)確導(dǎo)致的最直接的結(jié)果。 混雜偏倚 研究某個(gè)因素與某種疾病的關(guān)聯(lián)時(shí),由于某個(gè)既與疾病有制約關(guān)系,又與所研究的暴露因素有聯(lián)系的外來(lái)因素的影響,掩蓋或夸大了所研究的暴露因素與疾病的聯(lián)系特點(diǎn):不易識(shí)別,不易確定,需認(rèn)真細(xì)致地去解決控制方法: 無(wú)論何種研究,都可能遇到上述三種類型的偏倚,我們以RCT研究為例。我們都知道RCT研究是臨床研究證據(jù)可靠性最強(qiáng)的一類研究。為什么? RCT研究最大的優(yōu)點(diǎn),或者被認(rèn)為可靠性最強(qiáng),因?yàn)樗腔祀s偏倚最小。 但是RCT研究也會(huì)受到信息偏倚的影響,在測(cè)量指標(biāo)上容易受到人為主觀的影響,因此,RCT研究有一個(gè)措施來(lái)應(yīng)對(duì),盲法原則,患者、測(cè)量者者甚至統(tǒng)計(jì)分析人員都不能知道誰(shuí)是處理組,誰(shuí)是對(duì)照組。 RCT研究最大的問(wèn)題是選擇偏倚?,F(xiàn)在RCT研究越來(lái)越被人質(zhì)疑,是因?yàn)樗谌巳哼x擇上,太挑了,總是挑一些比較單一、標(biāo)準(zhǔn)嚴(yán)格限定、特征差異性小的一些病人(這樣容易得到陽(yáng)性結(jié)果),但是這樣的人群卻沒(méi)有代表性!因此近十年來(lái)才不斷有人呼吁,用真實(shí)世界研究來(lái)代替一部分RCT研究。RCT研究結(jié)果沒(méi)法真正代表廣大的總體人群,所以往往很多藥物在臨床試驗(yàn)是有效的,但是真正開展使用時(shí),效果就不突出。對(duì)于這點(diǎn),RCT的相應(yīng)補(bǔ)救措施是多中心臨床研究、大樣本人群研究,但還是無(wú)法完全避免選擇偏倚。 2. 混雜偏倚與混雜因素 混雜偏倚是指暴露因素與疾病發(fā)生或者疾病結(jié)局的相關(guān)(關(guān)聯(lián))程度受到其他因素(混雜因素)的歪曲或干擾。 比如,觀察性研究某藥物(X)的治療腫瘤的效果(Z),由于非隨機(jī),藥物(X)的使用還受到患者人口學(xué)、社會(huì)、經(jīng)濟(jì)因素(C)的影響。 例如:由于分組不均衡,藥物組多為中青年人群,對(duì)照組多為中老年人。 如果藥物組效果較好,有效率較高,這個(gè)結(jié)果可否要證明X與是否有真實(shí)關(guān)系? 不能,為什么要藥物組效果好?藥物組比對(duì)照組效果好的可能原因包括兩種可能 1) 藥物效果確實(shí)好 2) 年輕人效果比老年人效果好,所以年輕人比例高的藥物組,比老年人比例高的對(duì)照組生存率高。 所以,最終反應(yīng)的效果指標(biāo)比如RR值(本例為1.47),是藥物效果和年齡效果混雜一起的值,不能完全歸功于藥物。年齡就是混雜因素,它造成的偏差稱之為混雜偏倚。 3. 混雜偏倚一般如何會(huì)產(chǎn)生? 混雜偏倚在醫(yī)學(xué)研究的主要產(chǎn)生原因是分組不均衡。分組均衡的情況的情況下,比如假如上述例子是分組均衡的,那么藥物組和對(duì)照組年齡結(jié)構(gòu)都是一樣的,那么兩組人群年齡的效果是完全一樣,年齡對(duì)藥物因素的干擾作用為0,這就是我們之前說(shuō)的兩組具有可比性。完全可比的人群沒(méi)有混雜偏倚。 因此,RCT研究往往基本不存在著混雜偏倚,它采用的隨機(jī)化分組,因此,各組基本特征相似,具有可比性,分組均衡。 觀察性研究,分組不均衡,那么就可能其他因素的分布是不可比的,不可比的情況,就存在著混雜因素,可能會(huì)造成混雜偏倚。 新英格蘭醫(yī)學(xué)雜志2003年發(fā)表一篇綜述,系統(tǒng)總結(jié)觀察性研究和RCT研究在論證雌激素替代療法(HRT)對(duì)冠心病有保護(hù)作用嗎? 結(jié)果我們就會(huì)發(fā)現(xiàn),在冠心病的研究分析上,觀察性研究與RCT研究得到了截然不同的結(jié)果(一個(gè)是保護(hù)因素,一個(gè)是危險(xiǎn)因素) 由于這個(gè)原因,觀察性研究采用一般的統(tǒng)計(jì)學(xué)方法,雖然能克服隨機(jī)誤差,但無(wú)法克服混雜偏倚:
4. 什么樣的因素才可以稱之為混雜偏倚 實(shí)際上混雜因素不僅要分組是否均衡,它總共要滿足3個(gè)條件: 1) 與研究因素存在著相關(guān)或因果關(guān)系(本條件即為分組不均衡的結(jié)果) 2) 與結(jié)局存在因果關(guān)系 3) 不在研究因素與結(jié)局因果鏈上的之間(如果是,那么即為我們之前提過(guò)的中介變量) 比如:研究某藥物X的治療腫瘤的效果(Z),同時(shí)發(fā)現(xiàn),藥物X可能通過(guò)改變體內(nèi)的物質(zhì)Y而影響療效 由于非隨機(jī),藥物X的使用還受到患者人口學(xué)、社會(huì)、經(jīng)濟(jì)因素(C)的影響。 例如:由于分組不均衡,藥物組多為中青年人群,對(duì)照組多為中老年人。如果藥物效果較好,生存率較高,則年齡是典型的混雜因素(C),而Y是中介變量。 5. 如何判斷某個(gè)變量為混雜因素 混雜因素三個(gè)條件,其中第1)和第2)條件一般可以通過(guò)統(tǒng)計(jì)學(xué)方法來(lái)解決,第三個(gè)條件則主要基于專業(yè)知識(shí)判斷。 1)與研究因素存在著相關(guān)或因果關(guān)系 ☆采用t、卡方、方差、秩和 2)與結(jié)局存在因果關(guān)系 ☆采用線性(t檢驗(yàn))、logistic(卡方)、COX回歸 3) 不在研究因素與結(jié)局因果鏈上的之間 ☆ 主要是專業(yè)判斷 舉例:分析性別、吸煙對(duì)幽門螺桿菌(HP)的影響,判斷性別是否是混雜因素。 1)判斷吸煙在不同性別中分布是否不同:卡方檢驗(yàn):結(jié)果顯示,吸煙在性別中分布不同,男性中比例更高 2)判斷性別是否對(duì)Hp有影響:單因素logistic回歸。結(jié)果顯示,性別對(duì)HP影響有統(tǒng)計(jì)學(xué)意義(P<0.001) 3) 性別不在吸煙與HP因果鏈上的之間:專業(yè)判斷成立。 如果性別在他們因果關(guān)系鏈上,會(huì)是什么情況?吸煙會(huì)通過(guò)改變性別,而影響HP感染率(Are you kidding?) 因此,性別是混雜因素! 實(shí)際操作上,該過(guò)程過(guò)于復(fù)雜,往往針對(duì)上述三個(gè)方面的兩個(gè)方面來(lái)進(jìn)行論證1)+3)或者2)+3),陽(yáng)性結(jié)果稱之為可疑混雜因素??梢苫祀s因素在后期的統(tǒng)計(jì)分析過(guò)程中,很多時(shí)候比混雜因素更為常見。 本講就介紹到這里! 更多真實(shí)世界研究數(shù)據(jù)分析系列 1.【專題】如何正確開展多因素回歸分析?十二篇系列文章等你來(lái)閱讀 本公眾號(hào)大量資源全部免費(fèi)下載: 1. 醫(yī)學(xué)統(tǒng)計(jì)學(xué)習(xí)全套視頻,妙趣+高級(jí)+SPSS+測(cè)試題,讓你從入門到精通! 2. 重磅資源:100本“臨床試驗(yàn)與統(tǒng)計(jì)學(xué)方法”英文書籍大放送! 3.《中國(guó)統(tǒng)計(jì)年鑒》1978-2019,巨量呈現(xiàn)40年全國(guó)各行業(yè)指標(biāo)(包括衛(wèi)生、人口在內(nèi))! 4. 2006-2018中國(guó)衛(wèi)生統(tǒng)計(jì)年鑒合集 5. 不做實(shí)驗(yàn)如何利用臨床數(shù)據(jù)庫(kù)發(fā)表論文?精選臨床預(yù)測(cè)模型視頻合集 6. 重磅推薦:全網(wǎng)最全的醫(yī)學(xué)統(tǒng)計(jì)相關(guān)軟件,免費(fèi)下載,均已破解。 7. 如何制作與分析量表?中英文權(quán)威書籍來(lái)幫忙。 8. 教你如何撰寫臨床研究論文:臨床研究統(tǒng)計(jì)分析思路與統(tǒng)計(jì)圖表繪制方法 諸位,本公眾號(hào)現(xiàn)在已經(jīng)形成包括“樣本量估算方法”、“ Meta", “論文的統(tǒng)計(jì)表達(dá)方法”、“統(tǒng)計(jì)視頻”(R、醫(yī)學(xué)統(tǒng)計(jì)學(xué)、妙趣統(tǒng)計(jì)學(xué))、“科研工具合集”、“如何分析真實(shí)世界臨床研究數(shù)據(jù)”等系列,有興趣同仁們可以關(guān)注。
|
|
來(lái)自: 妙趣橫生統(tǒng)計(jì)學(xué) > 《待分類》