() 問卷(包括量表)是一種專門設(shè)計(jì)的書面調(diào)查表,通過問卷收集數(shù)據(jù)是心理學(xué)和其他社會(huì)科學(xué)實(shí)證研究的常用方法。問卷法的優(yōu)點(diǎn)是簡(jiǎn)便易行,可以在短時(shí)間內(nèi)獲得大范圍資料;問卷不記名,減少了回答者的心理壓力,有利于收集到真實(shí)的應(yīng)答結(jié)果;所得資料便于整理和統(tǒng)計(jì)分析(溫忠麟,2017a)。 數(shù)據(jù)初步處理 任何人都不可高估自己的注意力,為了避免錯(cuò)誤地鍵入數(shù)據(jù),檢查是必要的。好的做法是每輸入一個(gè)被試的數(shù)據(jù),隨即檢查一遍,然后才輸入下一個(gè)被試數(shù)據(jù)。數(shù)據(jù)完成輸入后,可以對(duì)每個(gè)變量做一些簡(jiǎn)單的計(jì)算和描述統(tǒng)計(jì),檢查是否有異常的被試、變量和數(shù)值。對(duì)于檢查無誤的原始數(shù)據(jù),如果所用量表存在反向計(jì)分的題目,需對(duì)反向題進(jìn)行重新編碼。問卷數(shù)據(jù)中通常一個(gè)題目就是一個(gè)變量,如果有被試對(duì)某個(gè)題目沒有作答,相應(yīng)的變量就存在缺失值 (missing value),需要處理。缺失類型有三種(Rubin,2004):完全隨機(jī)缺失 (MCAR)、隨機(jī)缺失(MAR)、非隨機(jī)缺失 (NMAR)。MCAR指某個(gè)變量X缺失的概率與其本身和研究中的其他變量都無關(guān)。MAR 指某個(gè)變量X 缺失的概率與研究中的某個(gè)或者某些變量有關(guān),但與X本身無關(guān)。NMAR 指某個(gè)變量X 缺失的概率與X 本身的取值有關(guān)(可能與其他變量也有關(guān))。 對(duì)于 MCAR 數(shù)據(jù),缺失數(shù)據(jù)是可以忽略的,簡(jiǎn)單地將有缺失的被試刪除(列刪法,listwise)就可以了,但樣本容量只能算刪除之后的。對(duì)于 MAR 數(shù)據(jù),如果引起缺失的變量與要估計(jì)的參數(shù)無關(guān), 則缺失數(shù)據(jù)也是可以忽略的。缺失種類不明的時(shí)候,只要缺失數(shù)據(jù)很少(如 5% 之內(nèi)),刪除有缺失的被試通常影響不大。 對(duì)于 NMAR數(shù)據(jù),或者 MAR 數(shù)據(jù)要估計(jì)的參數(shù)與引起缺失的變量有關(guān),缺失是不可忽略的,不能簡(jiǎn)單地將缺失數(shù)據(jù)刪除,通常的做法是缺失值填補(bǔ)(imputation)。 使用常用的 SEM軟件,可以不用填補(bǔ)缺失值, 而是在程序語句中指明缺失值( 如 Mplus,在 VARIABLE 下加上 MISSING= ALL (99) 表示所有變量中的“99”都是缺失值),軟件默認(rèn)用全息極大似然估計(jì)法 (full informationmaximum likelihood) 進(jìn)行參數(shù)估計(jì),該方法在缺失值理論下利用全部可用的數(shù)據(jù)信息進(jìn)行計(jì)算 (Collins, Schafer, & Kam, 2001)。 不少統(tǒng)計(jì)方法對(duì)變量有正態(tài)性假設(shè),因而需要分布檢驗(yàn)(檢驗(yàn)方法可參見溫忠麟,2016)。 量表評(píng)價(jià) 對(duì)于一項(xiàng)基于問卷的研究,即使研究者不擬使用結(jié)構(gòu)方程分析潛變量,而是使用量表合成分?jǐn)?shù)(各題得分均值或者總分)進(jìn)行統(tǒng)計(jì)分析,也需要建立測(cè)量模型(SEM包括測(cè)量模型和結(jié)構(gòu)模型),使用驗(yàn)證性因子分析(CFA) 做量表評(píng)價(jià),為后續(xù)的統(tǒng)計(jì)建模分析奠定基礎(chǔ)。 2.1 評(píng)價(jià)量表的結(jié)構(gòu)效度 CFA 的一個(gè)重要作用是評(píng)價(jià)量表的結(jié)構(gòu)效度。使用現(xiàn)有的或者改編的量表進(jìn)行測(cè)量時(shí),題目與潛變量(因子)的從屬關(guān)系是已知的,多維量表的維度(一個(gè)維度對(duì)應(yīng)于一個(gè)分量表)也是已知的,但由于被試和施測(cè)環(huán)境的差異,得到的數(shù)據(jù)未必符合已有的理論模型,故需通過 CFA 檢驗(yàn)量表的結(jié)構(gòu)效度(駱方, 張厚粲, 2006)。做法是用一個(gè)構(gòu)想的測(cè)量模型去擬合數(shù)據(jù),看擬合指數(shù) (fit index) 高低。 一般認(rèn)為,如果 CFI (Comparative Fit Index) 和 TLI (Tucker-Lewis Index;也稱為 NNFI,Non-normed Fit Index) 大于0.9(越大越好),RMSEA (Root Mean Square Error of Approximation) 和 SRMR (Standardized Root Mean square Residual) 小于0.08(越小越好), 則模型整體上擬合良好(溫忠麟 , 侯杰泰, Marsh, 2004),說明量表結(jié)構(gòu)符合預(yù)期。如果模型擬合欠佳,可以考慮探索性結(jié)構(gòu)方程模型 (ESEM),允許跨因子負(fù)荷,可以得到比較準(zhǔn)確的潛變量關(guān)系(麥玉嬌,溫忠麟 , 2013)。 CFA 首先要做的是驗(yàn)證題目與因子的從屬關(guān)系。如果部分題目的因子負(fù)荷過低(如標(biāo)準(zhǔn)化負(fù)荷小于0.4),則可考慮刪除這些題目(如果它們也不從屬于其他因子),將剩下題目做CFA并報(bào)告擬合指數(shù)。即使擬合指數(shù)表現(xiàn)良好,仍需進(jìn)一步考慮刪題前后量表的異同。從心理測(cè)量的角度看,每個(gè)因子的全部題目是測(cè)量該因子的一組代表性樣本。刪除題目是否適當(dāng),主要通過專業(yè)判斷刪除之后剩下的題目是否還有代表性(所以刪除的題目不能太多)。如果每個(gè)因子剩下的題目還有代表性,仍可以有效測(cè)量所測(cè)因子的行為或特質(zhì),則刪除題目是可以接受的。如初中數(shù)學(xué)測(cè)驗(yàn)包含代數(shù)、幾何、概率三個(gè)方面, 若刪除的都是幾何題致使代表性不足,則該測(cè)驗(yàn)已不能測(cè)量初中數(shù)學(xué)能力了。如刪除一兩道幾何題之后剩下的幾何題還可以有效測(cè)量幾何能力,則刪除題目是適當(dāng)?shù)?。但刪除題目以后得到的結(jié)果與前人的研究結(jié)果可能沒有可比性。 如果刪除題目之前已經(jīng)報(bào)告CFA 擬合指數(shù)并且擬合良好,刪除題目之后可以不再報(bào)告,因?yàn)閯h除負(fù)荷低的題目,通??偸强梢蕴岣吣P蛿M合程度,但最好報(bào)告刪除題目之后的 CFA 擬合指數(shù)。例如,有研究者根據(jù)CFA 結(jié)果,刪除因子負(fù)荷低于0.4 的題目進(jìn)行后續(xù)分析(任皓, 溫忠麟, 陳啟山, 2013)。 2.2 評(píng)價(jià)量表的信度 信度是衡量測(cè)驗(yàn)質(zhì)量的重要指標(biāo)。對(duì)于每個(gè)量表,都應(yīng)當(dāng)報(bào)告 Cronbach的α 系數(shù)。如果量表合成分?jǐn)?shù)有意義,在很一般的情況下(具體說就是題目之間的誤差不相關(guān)),α 系數(shù)是合成信度的下限。如果α 系數(shù)高到可以接受(例如,能力測(cè)驗(yàn)0.7 以上, 人格測(cè)驗(yàn) 0.6以上),合成信度就可以接受。如果α 系數(shù)過低,應(yīng)當(dāng)使用CFA 計(jì)算合成信度(溫忠麟, 葉寶娟 , 2011; 葉寶娟 , 溫忠麟 , 2012a)。比較好的做法是報(bào)告量表的合成信度及其置信區(qū)間(葉寶娟,溫忠麟 , 楊強(qiáng), 任皓,2013)。 2.3 檢驗(yàn)共同方法偏差 常用的是 Harman 單因子檢驗(yàn)(周浩,龍立榮, 2004),但已有研究指出單因子檢驗(yàn)存在問題, 推薦引入方法因子進(jìn)行檢驗(yàn) (Podsakoff, Mackenzie, Lee, & Podsakoff, 2003),即建立雙因子模型,在原有設(shè)計(jì)的因子基礎(chǔ)上加上一個(gè)方法因子作為全局因子(顧紅磊 , 溫忠麟, 2017; 顧紅磊 , 溫忠麟 , 方杰, 2014)。如果原來多個(gè)量表放在一起的 CFA 模型(因子之間允許相關(guān))加上方法因子后,模型擬合指數(shù)變好很多(例如,CFI 和 TLI提高幅度超過 0.1, RMSEA 和 SRMR 降低幅度超過 0.05),說明存在嚴(yán)重的共同方法偏差。 檢驗(yàn)共同方法偏差的同時(shí),可以一并考慮檢驗(yàn)變量(量表)的區(qū)分效度。如果兩個(gè)或多個(gè)量表的題目當(dāng)作一個(gè)因子的題目擬合模型,擬合指數(shù)沒有明顯變差(例如,CFI 和 TLI降低幅度不超過 0.03, RMSEA 和 SRMR 提高幅度不超過0.01),說明變量區(qū)分效度低。首先是所有題目放在一起的單因子模型,應(yīng)當(dāng)是擬合最差的一個(gè)。然后逐步增加因子, 最后是一個(gè)量表一個(gè)因子的模型,這個(gè)模型是系列模型中擬合最好的,擬合指數(shù)應(yīng)當(dāng)達(dá)到可以接受的標(biāo)準(zhǔn)才能進(jìn)行后續(xù) SEM 分析,不然可以考慮用各變量(量表)的合成分?jǐn)?shù)進(jìn)行建模(前提是合成信度可以接受)。 楊明等人(2017)研究職業(yè)勝任力對(duì)工作要求 -資源模型的影響機(jī)制時(shí),分析了五個(gè)變量的區(qū)分效度,通過對(duì)比不同因子模型,發(fā)現(xiàn)五因子模型優(yōu)于其它競(jìng)爭(zhēng)模型,故五個(gè)變量的區(qū)分效度良好。在這基礎(chǔ)上,建立雙因子模型檢驗(yàn)共同方法偏差,模型擬合指數(shù)見表 1。結(jié)果顯示,在五因子基礎(chǔ)上加入 表 1 變量的區(qū)分效度及共同方法偏差檢 注:JR= 工作資源;JD= 工作要求;CC= 職業(yè)勝任力;WE= 工作投入;EE= 情感衰竭。單因子:EE+WE +JR+CC+JD;兩因子:EE;WE+JR+CC+JD;三因子:EE; WE; JR+CC+JD; 四因子: EE; WE; JD; JR+CC; 五因子: EE; WE; JD; JR; CC。 共同方法因子后,模型擬合指數(shù)并沒有明顯的改善,CFI、TLI均只提高0 .01,說明共同方法偏差不嚴(yán)重。 題目打包 對(duì)于問卷數(shù)據(jù),使用 SEM 分析潛變量之間的關(guān)系(即結(jié)構(gòu)模型分析)已經(jīng)很常見,樣本容量需達(dá)到題目(指標(biāo))數(shù)量的 10倍以上,或者自由參數(shù)的 5 倍以上(侯杰泰等,2004)。若樣本容量達(dá)不到這個(gè)要求或量表每個(gè)維度的題目過多,可考慮使用題目打包法 (itemparceling),即把同一個(gè)量表的兩個(gè)或更多的題目打包成一個(gè)指標(biāo),用合成分?jǐn)?shù)(總分或均值)作為新指標(biāo)的分?jǐn)?shù)進(jìn)行分析(Kishton& Widaman, 1994; Yang, Nay, &Hoyle, 2010)。從某種意義上說,題目打包不是什么新做法,因?yàn)槭褂昧勘砗铣煞謹(jǐn)?shù)建立回歸模型,其實(shí)就是將題目打包當(dāng)作顯變量建模。打包法可使指標(biāo)數(shù)據(jù)質(zhì)量變好、模型擬合程度提高,而且估計(jì)偏差不大。 多重共線性檢驗(yàn) 對(duì)于回歸分析,若自變量之間相關(guān)很高,則可能存在多重共線性問題,導(dǎo)致參數(shù)估計(jì)出現(xiàn)偏差, 或者標(biāo)準(zhǔn)誤很大,模型失真(陳希孺,王松桂,1987)。如果各自變量的方差膨脹因子(variance inflation factor, VIF) 皆小于 5,一般認(rèn)為不存在多重共線性問題,VIF小于 10說明多重共線性問題不嚴(yán)重 (O' Brien, 2007)。以自變量Xj 為例,相應(yīng)的VIF =1/(1-R 2),其中R 2 是X,對(duì)其他自變量做回歸,得到的測(cè)定系數(shù)(即Xj 的變異被其他自變量解釋的比例)。VIF >5(或 10)意味著R 2 超過 0.8(或0.9)。也有文獻(xiàn)將 (1-R 2) 稱為容許度或容忍度 (tolerance), VIFj>5(或 10)意味著容許度 <.2(或 .1)。社科研究中很少出現(xiàn)嚴(yán)重的多重共線性問題。如何處理多重共線性問題,可參考回歸分析專著(例如,陳希孺,王松桂,1987)。 對(duì)于中介模型,如果中介變量和自變量相關(guān)非常高(如高達(dá) 0.9,此時(shí) VIF=5.26),則也有多重共線性問題,影響中介效應(yīng)和直接效應(yīng)的估計(jì)精確度和穩(wěn)定性(王惠文, 吳載斌 , 孟潔 , 2006)。對(duì)于調(diào)節(jié)效應(yīng)模型,變量中心化可以減少非本質(zhì)的共線性問題(溫忠麟, 劉紅云 , 侯杰泰 , 2012; Echambadi &Hess,2007)。例如,在葉寶娟、楊強(qiáng)、胡竹菁(2012) 的一項(xiàng)研究中,建模前各變量做了中心化處理,所有自變量的 VIF 均低于 1.28,故不存在多重共線性問題。 建模依據(jù) 社科中比較經(jīng)典的推論因果關(guān)系的三個(gè)準(zhǔn)則是 ( 溫忠麟,2017b; Cook&Campbell, 1979):(i)因在果之前發(fā)生;(ii) 因和果共同變化;(iii) 排除因果聯(lián)系外的其他解釋。其中第 (i) 個(gè)準(zhǔn)則涉及建模依據(jù), 即變量之間的先后順序需要理據(jù)。第 (ii) 個(gè)準(zhǔn)則是通過建模以后的統(tǒng)計(jì)分析來判斷,就是通常的顯著性、效應(yīng)量等議題,本文不擬涉及。第 (iii) 個(gè)準(zhǔn)則實(shí)際上就是變量控制的問題(見下一節(jié))。 模型反映了變量之間的關(guān)系和設(shè)定。對(duì)于直接關(guān)聯(lián)的兩個(gè)變量,可能是并列的相關(guān)關(guān)系,也可能是先因后果的影響關(guān)系(通常用箭頭表示)。建模需要有依據(jù),就是要求模型中的每個(gè)箭頭連結(jié)的兩個(gè)變量的先后順序都有理論、文獻(xiàn)或者生活經(jīng)驗(yàn)的支持。其中一種常用方法是,看兩個(gè)變量的屬性決定先后:如果X是比Y更加本質(zhì)的(或者是長久的、穩(wěn)定的、客觀的)屬性,則X在Y的前面(溫忠麟, 葉寶娟,2014)。區(qū)分變量順序的另一種方法是顛倒兩個(gè)變量的順序,看哪一個(gè)更容易解釋(溫忠麟 , 2017b)。如果不能用上面方法分清先后,可以通過所謂的交叉滯后設(shè)計(jì) ( 白學(xué)軍 , 2012; Kenny, 1975), 獲取歷時(shí)性的數(shù)據(jù),看看兩個(gè)變量究竟誰影響誰,或者誰影響更多一些。 變量控制變量控制是因果推理的重要環(huán)節(jié)。要控制的變量是除自變量外可能會(huì)對(duì)因變量造成影響的非研究變量。常見的控制變量是人口學(xué)變量,此外還要根據(jù)前人研究適當(dāng)考慮其他的控制變量。從獲取數(shù)據(jù)的方法設(shè)計(jì)來看,問卷法對(duì)非研究變量的控制遠(yuǎn)不如實(shí)驗(yàn)法,因而對(duì)問卷數(shù)據(jù)的統(tǒng)計(jì)控制尤為重要。最簡(jiǎn)單的做法是分別做自變量和因變量(SEM 則使用指標(biāo))對(duì)控制變量的回歸,用殘差作為變量的觀測(cè)值(溫忠麟,2017b)。例如,任皓等人 (2013) 注意到性別、年齡等人口統(tǒng)計(jì)學(xué)變量及教育、工作經(jīng)驗(yàn)等人力資本變量會(huì)對(duì)員工的心理資本和組織公民行為產(chǎn)生影響,故分別做心理資本、組織公民行為對(duì)這些控制變量的回歸,將相應(yīng)的殘差值作為心理資本、組織公民的觀測(cè)值進(jìn)行后續(xù)分析。 結(jié) 語 統(tǒng)計(jì)建模前的不少工作還是需要統(tǒng)計(jì)技術(shù)來完成。即使一項(xiàng)研究只是用量表合成分?jǐn)?shù)(總分或平均分)進(jìn)行簡(jiǎn)單的回歸分析,也需要使用CFA對(duì)所用的量表進(jìn)行評(píng)價(jià)。換句話說,基于問卷數(shù)據(jù)的研究, CFA 是不可或缺的工具,哪怕最后只是簡(jiǎn)單地做一個(gè)回歸分析。 如果要分析因果關(guān)系,一般來說問卷法不如實(shí)驗(yàn)法嚴(yán)密。但如果提出的因果順序在常識(shí)上、邏輯上和學(xué)理上是合理的,而且主要的無關(guān)變量也得到控制,那么問卷法也可以建模驗(yàn)證因果關(guān)系(溫忠麟, 2017b)。 本文只是介紹問卷數(shù)據(jù)建模之前需要考慮甚至完成的若干工作,但難以事無巨細(xì)地介紹具體該如何做,有需要的讀者可循本文參考文獻(xiàn)找到更多相關(guān)的文獻(xiàn)進(jìn)一步學(xué)習(xí)。 |
|