摘要:個(gè)體之間的差異不僅體現(xiàn)在那些通常被稱為“處理前異質(zhì)性”(pretreatment heterogeneity)的背景特征上,還體現(xiàn)在個(gè)體對(duì)特定處理、事件或干預(yù)的反應(yīng)中。處理與處理傾向(treatment and the propensity of treatment)之間的交互作用是社會(huì)科學(xué)中關(guān)于選入處理組和因果推斷問題的一個(gè)主要研究興趣。盡管“處理效應(yīng)異質(zhì)性”(treatment-effect heterogeneity)的重要性在因果推斷的文獻(xiàn)中已經(jīng)得到了廣泛的認(rèn)可,但社會(huì)科學(xué)定量實(shí)證研究(empirical quantitative social science research)還沒有將其完全納入。本文(1)描述了異質(zhì)性處理效應(yīng)研究的主要估計(jì)策略;(2)討論了近期關(guān)注因果效應(yīng)異質(zhì)性的研究,關(guān)注點(diǎn)在教育帶來的效應(yīng),以及我們由此得到的啟示;(3)利用上大學(xué)對(duì)公民參與的影響對(duì)該方法進(jìn)行了說明。本文的主要目的是鼓勵(lì)研究人員用對(duì)檢驗(yàn)處理前異質(zhì)性一樣的嚴(yán)格程度對(duì)處理效應(yīng)異質(zhì)性進(jìn)行例行檢驗(yàn)。 捕獲因果關(guān)系(1) 捕獲因果關(guān)系(2) 直接點(diǎn)擊藍(lán)色標(biāo)題查看上期推送 實(shí)證演示 在這一部分,我們會(huì)展示上述的方法,使用高等教育社會(huì)回報(bào)的例子。教育的社會(huì)回報(bào),特別是總體中的非優(yōu)勢群體的教育社會(huì)回報(bào),一直都是推廣教育機(jī)會(huì)均等公共政策的核心理由。如果不能算是決定因素,教育也可以說是社會(huì)參與的一個(gè)主要相關(guān)因素(Brand 2010)。一些研究識(shí)別了與評(píng)估教育對(duì)社會(huì)參與的因果效應(yīng)相聯(lián)系的內(nèi)生性問題,但是很少有研究識(shí)別潛在的處理效應(yīng)異質(zhì)性。Brand(2010)是一個(gè)例外,他強(qiáng)調(diào)了使用SM方法得到的在獲得大學(xué)教育傾向值上,大學(xué)對(duì)社會(huì)參與的異質(zhì)性處理效應(yīng)。我們通過比較一系列評(píng)估處理效應(yīng)異質(zhì)性的方法來擴(kuò)展Brand(2010)的研究。 數(shù)據(jù)描述 我們使用1979年全國青年縱向調(diào)查(National Longitudinal Survey of Youth,NLSY)數(shù)據(jù)來評(píng)估上大學(xué)對(duì)社會(huì)參與的異質(zhì)性因果效應(yīng)。NLSY是一個(gè)具有全國代表性的樣本,有12686個(gè)在1979年為14-22歲之間的受訪者。這些個(gè)體一直到1994年每年都會(huì)被追訪,最近他們兩年被追訪一次。我們使用1979-2006年的數(shù)據(jù)。我們將樣本限定為在基期1979年的年齡為14-17歲(n=5582),截止到2006年至少上完了十二年級(jí)(n=4827),2006年的教育獲取和社會(huì)參與指標(biāo)不缺失(n=3452)。這些限制是為了保證我們所使用的所有指標(biāo)是在大學(xué)之前的,特別是能力方面的指標(biāo),也是為了比較大學(xué)畢業(yè)生和至少完成了高中教育的個(gè)體。由于數(shù)據(jù)磨損和無應(yīng)答(attrition and nonresponse)導(dǎo)致的缺失數(shù)據(jù),更多的是有著非優(yōu)勢家庭背景和更低教育程度的。附錄A描述了大學(xué)前協(xié)變量和大學(xué)后社會(huì)參與指標(biāo)。大學(xué)前指標(biāo)將經(jīng)濟(jì)學(xué)和社會(huì)學(xué)關(guān)于教育和職業(yè)成就的研究納入進(jìn)來,他們的衡量是直接的。詳細(xì)的可參見Brand(2010)。上大學(xué)可能性會(huì)隨著性別、人種和種族、家庭背景、學(xué)術(shù)成就,朋友的計(jì)劃和父母在預(yù)期方向的鼓勵(lì)等發(fā)生變化。我們使用兩個(gè)對(duì)立的2006年的社會(huì)參與指標(biāo),這兩個(gè)指標(biāo)是只在2006年被收集。兩個(gè)指標(biāo)是,詢問受訪者他們是否在過去的12個(gè)月內(nèi)參與了無報(bào)酬的志愿工作(1)市民的、社區(qū)的或者青年團(tuán)體(2)慈善組織或社會(huì)福利團(tuán)體。大約13%的大學(xué)畢業(yè)生和5%的非大學(xué)畢業(yè)生志愿參加了市民的、社區(qū)的或者青年團(tuán)體,9%的大學(xué)畢業(yè)生和4%的非大學(xué)畢業(yè)生志愿參加了慈善組織或社會(huì)福利團(tuán)體。 處理效應(yīng)分析 同質(zhì)效應(yīng)估計(jì) 我們首先使用logit回歸模型,在給定一系列可觀測協(xié)變量的情況下,估計(jì)每個(gè)個(gè)體大學(xué)完成情況的傾向得分。表11.1給出了logit模型估計(jì)結(jié)果,支持了關(guān)于大學(xué)教育的決定因素的文獻(xiàn)結(jié)果。表11.2給出了在同質(zhì)性效應(yīng)假定的情況下,使用logit回歸模型估計(jì)的大學(xué)完成情況對(duì)兩個(gè)社會(huì)參與指標(biāo)產(chǎn)生的平均效應(yīng)。第一個(gè)模型代表了雙變量關(guān)聯(lián)(bivariate association);第二個(gè)模型控制了傾向得分估計(jì)值。二元變量模型表明,與非大學(xué)畢業(yè)生相比,大學(xué)畢業(yè)生有3.4倍的可能性去參加市民的、社區(qū)的或者青年團(tuán)體,2.4倍的可能性去參加慈善組織或社會(huì)福利團(tuán)體,結(jié)果具有高度統(tǒng)計(jì)顯著性??刂粕洗髮W(xué)的傾向得分估計(jì)值后,我們發(fā)現(xiàn)這連個(gè)數(shù)字變?yōu)?.1和1.4。上大學(xué)的傾向得分對(duì)兩種形式的志愿活動(dòng)都有顯著正向影響。在調(diào)整了傾向得分的模型中,點(diǎn)估計(jì)值減少了,上大學(xué)對(duì)參與慈善組織或社會(huì)福利團(tuán)體的影響不再具有統(tǒng)計(jì)顯著性。 同質(zhì)性效應(yīng)假定的模型在社會(huì)科學(xué)實(shí)證研究中普遍存在。然而,當(dāng)處理效應(yīng)異質(zhì)性存在時(shí),根據(jù)總體構(gòu)成的不同,平均效應(yīng)也有會(huì)很大差異。接下來,我們?cè)u(píng)估上大學(xué)對(duì)社會(huì)參與是否存在異質(zhì)性處理效應(yīng)。
表11.3給出了使用加權(quán)回歸和傾向得分匹配法(最近鄰匹配和核匹配)估計(jì)的 最近鄰匹配和核匹配方法得到的 傾向得分分布的統(tǒng)計(jì)建模
![]() 表11.4給出了在傾向得分分層(1級(jí)水平,level 1)上大學(xué)對(duì)社會(huì)參與影響的logit回歸估計(jì)值,以及使用方差加權(quán)最小二乘法估計(jì)的效應(yīng)趨勢(2級(jí)水平,level 2)。2級(jí)水平上的兩類志愿活動(dòng)指標(biāo)的斜率都表明上大學(xué)的影響會(huì)隨著上大學(xué)傾向的增加而降低。對(duì)于市民的、社區(qū)的或者青年團(tuán)體,2級(jí)水平上的斜率表明一單位的傾向得分等級(jí)變化會(huì)帶來0.26單位上大學(xué)效應(yīng)的減少。也就是說,相比于層1的非大學(xué)畢業(yè)生,1級(jí)水平的估計(jì)值變動(dòng)范圍是,層1大學(xué)畢業(yè)生有7.6倍的可能性參加市民的、社區(qū)的或者青年團(tuán)體,而層7的值相同。類似的,對(duì)于參與慈善組織或社會(huì)福利團(tuán)體來說,2級(jí)水平的斜率表明一單位的傾向得分等級(jí)變化會(huì)帶來0.20單位上大學(xué)效應(yīng)的減少,變動(dòng)范圍為層1的3.1到層7的0.6。附錄B給出了根據(jù)傾向得分值和大學(xué)完成情況分出的各層,以及處理效應(yīng)模式的進(jìn)一步證據(jù)。根據(jù)上大學(xué)傾向得分進(jìn)行的分層在大學(xué)畢業(yè)生之間是平均分配的,非大學(xué)畢業(yè)生的志愿活動(dòng)存在一個(gè)社會(huì)經(jīng)濟(jì)學(xué)梯度(socioeconomic gradient),尤其是對(duì)于市民的、社區(qū)的或者青年團(tuán)體來說,在完成大學(xué)學(xué)業(yè)的非優(yōu)勢個(gè)體中產(chǎn)生了較大的可觀測處理效應(yīng)。 圖11.1描繪了表11.4的結(jié)果,圖中的點(diǎn)代表1級(jí)水平斜率的估計(jì)值,線代表2級(jí)水平的斜率。我們畫出了不同層的志愿活動(dòng)的平均差分,而不是logit回歸系數(shù),這是為了與下述平滑差分結(jié)果作對(duì)比。該圖描繪了上大學(xué)對(duì)兩種形式的社會(huì)參與的處理效應(yīng)都隨著上大學(xué)傾向值的增加而減少。圖11.1還表明處理效應(yīng)是潛在非線性的。為了研究這種可能性,我們換成非參數(shù)方法。 ![]() 為了用匹配平滑法估計(jì)異質(zhì)性處理效應(yīng),我們利用傾向得分估計(jì)值把處理組和控制組個(gè)體進(jìn)行匹配,并計(jì)算了其結(jié)果之間的差分,將匹配好的處理組和實(shí)驗(yàn)組單位之間的差分,以傾向得分為x軸作圖,擬合出一條平滑曲線。對(duì)于平滑差分法來說,我們?cè)趦A向得分上對(duì)兩個(gè)獨(dú)立的非參數(shù)回歸模型結(jié)果變量進(jìn)行擬合,一個(gè)是處理組的,一個(gè)是控制組的。MS法和SD法得到的結(jié)果類似,為了節(jié)省空間,我們僅列出了SD方法的結(jié)果。我們使用局部多項(xiàng)式回歸作為平滑工具(等級(jí)1,寬度0.2)。組回歸結(jié)果之間的差分提供了異質(zhì)性處理效應(yīng)的一個(gè)估計(jì)值。 ![]() 圖11.2為相應(yīng)的結(jié)果曲線。與圖11.1的不同是,x軸不再是分散的傾向值分層,而是連續(xù)的傾向值。SD法提供了一個(gè)全面的非參數(shù)處理效應(yīng)異質(zhì)性,而不是強(qiáng)行給出處理效應(yīng)異質(zhì)性的方程形式。對(duì)于市民志愿活動(dòng)組,在給定SM法得到的線性趨勢的情況下,我們發(fā)現(xiàn)差分在中高傾向值部分比較平緩,在高傾向值部分的差分大于我們預(yù)期。對(duì)于慈善志愿活動(dòng)組,處理效應(yīng)的線性性質(zhì)并不是一個(gè)合理的形式,中高傾向值部分比較平緩,然后傾向值分布的上端(upper end)出現(xiàn)一個(gè)顯著的下降。因此,我們發(fā)現(xiàn)了在上大學(xué)傾向值上潛在的處理效應(yīng)差異,這在我們檢查加權(quán)回歸、傾向得分匹配法和SM法結(jié)果時(shí)是被忽略的。 工具變量 正如我們前面所說的,當(dāng)存在處理效應(yīng)異質(zhì)性時(shí),工具變量估計(jì)應(yīng)該被理解為LATE。根據(jù)Carniero et al.(2011)的研究,我們打算考慮使用來自NLSY的個(gè)人地理編碼數(shù)據(jù)作為兩個(gè)工具變量,一個(gè)是14歲時(shí)當(dāng)?shù)卮髮W(xué)的可獲取性,一個(gè)是17歲時(shí)當(dāng)?shù)氐氖I(yè)人數(shù)。因?yàn)槲覀兊姆治鍪顷P(guān)于上大學(xué)對(duì)社會(huì)參與的影響而不是收入,我們首先質(zhì)疑排他性限制是否成立。也就是說,我們能不能合理的假設(shè),在社區(qū)內(nèi)有一所大學(xué)會(huì)只通過其對(duì)個(gè)人教育獲取的影響來對(duì)社會(huì)參與產(chǎn)生影響。在給定當(dāng)?shù)卮髮W(xué)可獲取性的情況下,我們可能會(huì)假定,更多受過教育的當(dāng)?shù)厝罕?,?huì)帶來更高水平的社會(huì)參與,這反過來也可能會(huì)帶來與個(gè)人教育水平無關(guān)的更高的社會(huì)參與(Putnam 2000)。使用當(dāng)?shù)氐氖I(yè)人數(shù)作為工具變量時(shí)也會(huì)有類似的問題。Brand and Burgard(2008)表示,裁員對(duì)社會(huì)參與有顯著的負(fù)向影響,相應(yīng)地,高水平的失業(yè)可能會(huì)影響與教育獲取無關(guān)的社會(huì)參與水平。 但是,由于我們衡量2006年的大學(xué)完成情況時(shí),受訪者年齡40出頭,我們對(duì)于排他性限制的顧慮可以緩和一下,尤其是使用17歲時(shí)當(dāng)?shù)厥I(yè)人數(shù)作為工具變量時(shí)。我們這樣衡量大學(xué)效應(yīng)是由于我們感興趣的是,上大學(xué)對(duì)社會(huì)參與的影響,不管是上完高中馬上上大學(xué)還是之后再上大學(xué)。但是,在工具變量有效時(shí),某些個(gè)體完成大學(xué)的時(shí)間和在社區(qū)居住的時(shí)間之間的分離,會(huì)導(dǎo)致比排他性限制更緊迫的問題,弱工具變量問題。將上大學(xué)對(duì)當(dāng)?shù)厥I(yè)人數(shù)和大學(xué)可獲取性回歸時(shí),第一階段的F統(tǒng)計(jì)量分別是3.04和1.02。上大學(xué)與工具變量之間的相關(guān)關(guān)系低于0.05。如Bound(2005)指出的,工具變量與內(nèi)生解釋變量之間的弱相關(guān)性很普遍。弱工具變量問題加劇了其他工具變量假設(shè)導(dǎo)致的偏誤,包括排他性限制、獨(dú)立性假設(shè)和單調(diào)性假設(shè)。 關(guān)于這一點(diǎn),我們決定不再使用工具變量分析。盡管沒有把工具變量法結(jié)果與其他結(jié)果比較很遺憾,但我們提供了一個(gè)警示說明,盡管工具變量是因果分析的一個(gè)有用工具,但找到一個(gè)好工具變量很難。 結(jié)論 本文中,我們描述了學(xué)習(xí)處理效應(yīng)異質(zhì)性的重要性以及操作方法,我們的關(guān)注點(diǎn)在于處理與處理傾向之間的交互作用。我們沒有說這是社會(huì)意義(social significance)上唯一的交互作用,特定的核心協(xié)變量之間的交互作用可能對(duì)某些特定研究更為重要。但是,對(duì)于有關(guān)因果關(guān)系和選擇(causality and selection)的處理效應(yīng)差異問題來說,傾向得分是重要的。傾向得分對(duì)于通過降維(dimensionality)來說明處理前異質(zhì)性的研究來說是有幫助的(Rosenbaum and Rubin 1983, 1984),類似地,傾向得分對(duì)于處理效應(yīng)異質(zhì)性的研究來說也是一種權(quán)宜之計(jì)。 處理效應(yīng)異質(zhì)性有助于理解稀缺社會(huì)資源如何在一個(gè)非平等社會(huì)中進(jìn)行分配、社會(huì)和行為研究設(shè)計(jì)以及社會(huì)政策。有了一個(gè)關(guān)注處理前異質(zhì)性的研究設(shè)計(jì),我們就可以對(duì)處理效應(yīng)估計(jì)值的內(nèi)部有效性(internal validity)進(jìn)行評(píng)估,也就是我們?cè)诤畏N程度上成功地得到被研究總體的因果效應(yīng)。但是,如果有了一個(gè)關(guān)注處理效應(yīng)異質(zhì)性的研究設(shè)計(jì),我們還可以評(píng)估處理效應(yīng)估計(jì)值的外部有效性(external validity),即在另一個(gè)語境下的研究結(jié)果的預(yù)測價(jià)值。也就是說,當(dāng)個(gè)體對(duì)處理的反應(yīng)存在差異時(shí),處理效應(yīng)會(huì)依據(jù)總體構(gòu)成的不同而存在巨大差異,我們必須要針對(duì)特定的子總體(subpopulation)給出特定的處理效應(yīng)估計(jì)值解讀。如果一項(xiàng)處理的花費(fèi)較高且執(zhí)行困難,就會(huì)導(dǎo)致該處理只能被施加給那些有可能從其中獲得最大利益的實(shí)驗(yàn)對(duì)象,而這樣一來,增加處理組實(shí)驗(yàn)對(duì)象可能會(huì)導(dǎo)致平均有效性(average effectiveness)降低。相反地,如果機(jī)智的個(gè)體得到一項(xiàng)花費(fèi)較高的處理但不一定能夠從中獲益時(shí),提高處理的可獲取性可能會(huì)增加處理接受者(treatment recipients)的平均處理效應(yīng)。如果政策制定者了解處理效應(yīng)異質(zhì)性的模式(pattern),他們就可以針對(duì)個(gè)體更有效的分配不同形式的實(shí)驗(yàn)處理,以平衡相互矛盾的目標(biāo),例如針對(duì)一個(gè)給定總體的減少成本、最大化平均收益和減少收益差異的目標(biāo)。 我們討論并展示了一系列用于學(xué)習(xí)處理效應(yīng)異質(zhì)性的方法。在我們給出的關(guān)于上大學(xué)對(duì)社會(huì)參與影響的例子中,我們發(fā)現(xiàn),使用加權(quán)回歸和傾向得分匹配得到的非處理組(untreated,TUT)的處理效應(yīng)要大于處理組(treated,TT)的處理效應(yīng)。點(diǎn)估計(jì)的估計(jì)值更小,且使用匹配得到的一些處理效應(yīng)在統(tǒng)計(jì)上不顯著,這一差異是在意料之中的,因?yàn)槠ヅ浞ü烙?jì)值是將實(shí)驗(yàn)單位與更少的控制組單位比較,因此有可能會(huì)得到更小的偏差(bias)但會(huì)損失一些有效性(efficiency)。接下來,我們使用分層法(stratification-multilevel)和平滑差分法(smoothing-differencing)根據(jù)傾向得分分布檢驗(yàn)了處理效應(yīng)。分層法分析使得TT與TUT之間的差異變大,這說明上大學(xué)對(duì)于個(gè)體志愿活動(dòng)參加情況的影響在那些上大學(xué)可能性更低的個(gè)體中更大。但是,對(duì)使用該方法得到的七個(gè)平衡傾向值分層(balanced propensity strata)進(jìn)行估計(jì),我們得到了比只分析TT與TUT更好的分層估計(jì)值(graded estimates)。使用分層法,我們發(fā)現(xiàn)上大學(xué)對(duì)于個(gè)體志愿活動(dòng)參加情況的影響的異質(zhì)性在統(tǒng)計(jì)上顯著,這表明,隨著上大學(xué)的傾向值增加,上大學(xué)帶來的效應(yīng)降低。該分析同時(shí)也揭露了處理效應(yīng)的潛在非線性的性質(zhì),我們使用平滑差分法進(jìn)行的分析證實(shí)了其對(duì)線性趨勢的偏離。最后,我們考慮了用于估計(jì)局部平均處理效應(yīng)的工具變量,與特定子總體相匹配的處理效應(yīng),這些子總體因?yàn)楣ぞ咦兞康拇嬖诙箤?shí)驗(yàn)處理發(fā)生了改變。與前述方法相比,該分析不依賴于可忽略性假設(shè)(ignorability assumption),但是有效的工具變量很難獲取,在我們的演示中,我們的工具變量是弱工具變量,所以是沒有用的。 Halaby(2004)的注釋寫道“…因果推斷不能被減少至適用于數(shù)據(jù)的一個(gè)公式。因?yàn)楦鶕?jù)觀測數(shù)據(jù)得到的因果推斷從本質(zhì)上說就是不確定的,它給予實(shí)驗(yàn)設(shè)計(jì)大量的基本技巧(basic techniques)”(p541)。我們所描述的用于評(píng)估處理效應(yīng)異質(zhì)性的分析方法,會(huì)依據(jù)不同的假設(shè)而存在不同的優(yōu)缺點(diǎn)。但是,這些方法也是識(shí)別具有不同接受處理處理可能性的子總體的不同方式,正因如此,對(duì)基本技巧的分析會(huì)得到關(guān)于處理效應(yīng)異質(zhì)性更為深刻的見解。由于處理效應(yīng)異質(zhì)性在社會(huì)科學(xué)研究中仍然出現(xiàn)較少,其實(shí)證評(píng)估非常少見,希望我們前述的內(nèi)容可以促進(jìn)處理效應(yīng)異質(zhì)性研究在實(shí)踐中的分析技巧的使用。 (完) 編輯:林毅 |
|