作者:朱馳 單位:上海市東方醫(yī)院南院檢驗科 上一篇《超實用干貨—檢驗人最常用的統(tǒng)計學分析方法梳理(一)》我們簡單梳理了常用的比較分析的統(tǒng)計檢驗方法及數(shù)據(jù)資料類型的確定。 一般來說,兩組或多組樣本在比較檢驗時如果多項指標有顯著差異,我們下一步通常會探討引起組別產(chǎn)生質的差別的影響因素,即自變量對因變量的影響是否具有統(tǒng)計學意義。 今天我們就來梳理一下SPSS作logistic回歸分析。 在做logistic回歸分析前,我們要知道分析研究的自變量、因變量是什么。 首先,因變量通常為所研究的變量,可以為連續(xù)型也可為分類的變量;而自變量是用來解釋或說明因變量變化的變量,可以為連續(xù)型也可為分類的變量,為一個或多個,注意,各自變量間應獨立。 另外,何為回歸分析? 第一,自變量與因變量有沒有關系? 第二,因變量與自變量之間有什么關系,具體的數(shù)據(jù)模型是什么?即模型檢驗和回歸系數(shù)檢驗。 Wald檢驗——用于單個回歸系數(shù)β的檢驗; 似然比檢驗——是對整個模型的可行性進行檢驗; 比分檢驗——用于變量的篩選; 在足夠大的樣本前提下,三者的結果大多一致;而小樣本時,似然比結果更可靠,Wald檢驗效果較差。 Logistic回歸分析與線性回歸不同,屬于概率型非線性回歸,是研究結果與各影響因素之間關系的分析方法。 簡單回歸模型中,要求因變量為連續(xù)型變量,且要求符合正態(tài)性和方差齊性。當實際因變量為分類變量時,一般采用logistic回歸模型進行數(shù)據(jù)分析,可分為二項分類和多項分類logistic回歸分析。 在用SPSS作二分類logistic回歸分析時,因變量為二分類變量,界面中的協(xié)變量就是我們所說的自變量;方法選擇輸入;分類選擇與最后一個對比(其他也可,主要區(qū)別在結果解釋時與選擇的變量的比較);選項:exp(B)的CI95%相當于優(yōu)勢比(OR值)。 在輸出的結果中,我們主要觀察一下四個方面。 第一,模型系數(shù)的綜合檢驗:一般認為P<0.05模型有統(tǒng)計學意義; 第二,模型匯總:模型R方對模型的預測能力評估; 第三,分類表:表示對因變量的預測正確率; 第四,也是最重要的,方程中的變量,是針對自變量與因變量的影響關系模型函數(shù)確定,一般認為P<0.05為有意義。 兩個重要的參數(shù):回歸系數(shù)和優(yōu)勢比。 表示在控制其他自變量不變得情況下,該自變量變化一個單位引起因變量變化的平均大小。 某事件發(fā)生與不發(fā)生的概率比,即與對比的變量相比,該變量引起因變量變化的概率是對比變量的幾(OR)倍。 若自變量的β>0,則OR>1,表示該自變量為引起因變量變化的危險因素; 若β<0,則OR<1,表示該自變量為引起因變量變化的保護因素; 若β=0,則OR=1,表面該自變量對因變量無影響。 當因變量為多個分類變量時,常采用多項分類logistic回歸。 1、多項無序分類變量 多個因變量的取值有時無大小順序,如因變量為職業(yè)(學生、教師、工人、商人)或者居住城市(上海、江西、重慶、新疆)等,這樣的變量類型又稱為多項無序分類變量,又稱為名義變量。 名義變量與自變量之間建立的回歸模型被稱為多項分類logistic回歸模型。在統(tǒng)計界面,我們發(fā)現(xiàn)自變量可以指定為因子,也可指定為協(xié)變量。 一般認為:自變量為分類變量的指定為因子;自變量為連續(xù)變量的指定為協(xié)變量。輸出結果與二分類結果相似,從模型擬合信息、似然比檢驗等觀察,但值得注意的是,多項分類logostic回歸分析的偽R方一般不大。 2、有序變量 當因變量為多個分類變量并且為有序變量時,如高血壓分級為:低危、中危、高危,療效為:無效、一般、有效等等級時,此時需要用有序的logistic進行分析。輸出結果的描述與上述一致,其中,參數(shù)估計值中,表中閾值即代表常數(shù)項。 當然,想要做好一項完美的logistic回歸分析還需要扎實的統(tǒng)計基礎及大量的練習;希望本文對稍有軟件操作功底的同仁們在分析研究時有一定的幫助。 說明:本文為原創(chuàng)投稿,不代表國際檢驗醫(yī)學傳媒、檢驗醫(yī)學微信平臺觀點。轉載時請注明來源及原創(chuàng)作者姓名和單位。 編輯:徐少卿 審校:陳雪禮 |
|