日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

PSM-DID的經(jīng)典方法與野路子(二):多期PSM-DID

 liyu_sun 2021-04-11

前期推文提及,“傾向得分匹配-雙重差分法”(Propensity Score Matching Difference in Differences,簡(jiǎn)記PSM-DID)的經(jīng)典方法假設(shè)數(shù)據(jù)為兩期面板,其中處理前(pre-treatment)一期,而處理后(post-treatment)一期。PSM-DID有時(shí)也稱為“匹配倍差法”。

PSM-DID的經(jīng)典方法:?jiǎn)纹谄ヅ?/strong>

本質(zhì)上,PSM-DID的經(jīng)典方法使用“單期匹配”。由于兩期面板在處理前只有一期,故PSM-DID的經(jīng)典方法天然地適用于兩期面板;比如萬(wàn)海遠(yuǎn)、李實(shí)(2013,經(jīng)濟(jì)研究),賈俊雪、寧?kù)o(2015,管理世界),徐志剛等(2018,管理世界)。

圖片

事實(shí)上,對(duì)于一類特殊的多期面板,PSM-DID的經(jīng)典方法依然適用,即處理前只有一期的多期面板。比如Fowlie et al. (2012, AER)使用排放機(jī)構(gòu)的4期面板數(shù)據(jù),研究南加州“氧化氮交易項(xiàng)目”(NOx trading program)的環(huán)保效應(yīng)。其中,第1期為處理前,而2-4期為處理后??蓪⒋藭r(shí)間結(jié)構(gòu)記為 1|3(即處理前1期,而處理后3期)。

圖片

類似地,何靖(2016,中國(guó)工業(yè)經(jīng)濟(jì))使用2009-2013年的銀行面板數(shù)據(jù),研究延付高管薪酬對(duì)銀行風(fēng)險(xiǎn)承擔(dān)的政策效應(yīng),其時(shí)間結(jié)構(gòu)為1|4,即處理前1期,而處理后4期。

圖片

在Stata的具體操作方面,在進(jìn)行傾向得分的單期匹配時(shí),如果使用1對(duì)1的最近鄰匹配(nearest neighbor matching),則在完成單期匹配后,只要?jiǎng)h除未匹配的觀測(cè)值,即可得到所謂“匹配樣本”(matched sample)。然后,針對(duì)此匹配樣本進(jìn)行通常的雙重差分估計(jì)(即雙向固定效應(yīng)模型),即可得到PSM-DID估計(jì)量。

另一方面,在進(jìn)行傾向得分的單期匹配時(shí),如果使用“核匹配”(kernel matching),則可使用Stata命令diff一步完成PSM-DID估計(jì),詳見《高級(jí)計(jì)量經(jīng)濟(jì)學(xué)及Stata應(yīng)用》(陳強(qiáng),2014,第2版)。

PSM-DID的野路子

PSM-DID的經(jīng)典方法雖然有堅(jiān)實(shí)的理論基礎(chǔ)(Heckman et al., 1997, 1998)。但對(duì)于實(shí)踐中經(jīng)常出現(xiàn)的多期面板,單期匹配并不能滿足實(shí)證研究者的全部需要。為此,實(shí)證研究者自行“發(fā)明”了一些其他探索性的PSM-DID方法,在某種意義上相當(dāng)于“野路子”(土辦法),目前均尚無(wú)嚴(yán)格的理論證明。當(dāng)然,“野路子”未必就不對(duì)(發(fā)表論文已見諸中英文期刊),也可能是計(jì)量實(shí)踐領(lǐng)先于計(jì)量理論(故“野路子”在本文不含貶義)。

本文將PSM-DID的野路子大致歸納為以下幾類,即代表期匹配、混合匹配、逐期匹配、協(xié)變量平均匹配、傾向得分平均匹配、傾向得分二階矩匹配,并分別進(jìn)行介紹。

代表期匹配

對(duì)于處理前不止一期的多期面板數(shù)據(jù),如果硬要進(jìn)行單期匹配,一種做法就是從處理前的各期中,選取最有代表性的一期進(jìn)行單期匹配。比如,盛丹、陸毅(2016,世界經(jīng)濟(jì))使用1998-2007年的企業(yè)面板,在研究出口貿(mào)易是否提供勞動(dòng)者工資的集體議價(jià)能力時(shí),即以2000年作為代表期進(jìn)行單期匹配。

根據(jù)該文解釋,這樣做的理由在于,“2001年出口進(jìn)入企業(yè)數(shù)量最多,為953家。為此,我們選取2001年為匹配的基準(zhǔn)年份,953家出口進(jìn)入企業(yè)為處理組,并且以2000 年作為出口前的年份,樣本中一直未出口的企業(yè)為10672家,作為對(duì)照組?!?/p>

圖片

顯然,使用代表期匹配會(huì)損失一定的樣本容量。在此例中,由于僅考慮2001年的出口進(jìn)入企業(yè),使得處理組僅剩下953家企業(yè)。

混合匹配

多期PSM-DID的另一匹配方式為“混合匹配”,即將面板數(shù)據(jù)視為橫截面數(shù)據(jù)(類似于混合回歸,即pooled regression),為處理組在處理期的每條觀測(cè)值(對(duì)應(yīng)于處理組的每位個(gè)體與每個(gè)處理時(shí)期),在控制組中尋找傾向得分最為接近的觀測(cè)值進(jìn)行匹配。

混合匹配的最大問(wèn)題在于,可能發(fā)生“時(shí)間錯(cuò)配”,即處理組在處理期的某位個(gè)體,可能與不同期的控制組個(gè)體相匹配,這樣就無(wú)法有效控制“時(shí)間固定效應(yīng)”(time fixed effects)或“時(shí)間趨勢(shì)”(time trend)。

在一篇最新發(fā)表的論文中,謝申祥等(2021,統(tǒng)計(jì)研究)指出,混合匹配還可能存在“自匹配”問(wèn)題,即處理組在處理期的某位個(gè)體與處理前的同一個(gè)體相匹配。如果發(fā)生自匹配,則雙重差分法即退化為“差分法”(因?yàn)橹皇峭粋€(gè)體的前后兩期差分),故也無(wú)法控制時(shí)間效應(yīng),容易導(dǎo)致偏差。

幸運(yùn)的是,自匹配現(xiàn)象在實(shí)踐中并不容易發(fā)生,因?yàn)橐话銇?lái)說(shuō),一位個(gè)體要么屬于處理組(只要有一期得到處理即可),要么屬于控制組(始終沒(méi)有處理),其組別從屬關(guān)系通常不會(huì)改變。

圖片

總之,基于混合匹配的這些缺點(diǎn),在進(jìn)行PSM-DID估計(jì)時(shí),應(yīng)盡量避免使用混合匹配。雖然目前還難以確定文獻(xiàn)中哪些論文使用了混合匹配,但有些中文論文在使用PSM-DID時(shí)對(duì)于匹配的細(xì)節(jié)語(yǔ)焉不詳,故也不排除這種可能性。

逐期匹配

多期PSM-DID的另一匹配方式為逐期匹配,即在進(jìn)行傾向得分匹配時(shí),限制僅在同期的控制組個(gè)體尋找最合適的匹配。例如,Heyman et al. (2007, JIE)使用1996-2000年的瑞典企業(yè)面板數(shù)據(jù),研究外資企業(yè)是否存在“工資溢價(jià)”(wage premium)。

圖片

又比如,Bockerman and Ilmakunnas (2009, Health Economics)使用1996-2001年的芬蘭家庭面板數(shù)據(jù),研究失業(yè)對(duì)于“自我健康評(píng)價(jià)”(self-assessed health)的影響。

圖片

在中文期刊中,孫文凱、王億杰(2016,經(jīng)濟(jì)學(xué)季刊),王庶、岳希明(2017,經(jīng)濟(jì)研究),郝項(xiàng)超等(2018,經(jīng)濟(jì)研究)均使用了逐期匹配的方法。

顯然,逐期匹配可以避免上述混合匹配所存在的“時(shí)間錯(cuò)配”與“自匹配”問(wèn)題,故是目前多期PSM-DID的主流方法。然而,逐期匹配也存在缺陷。由于對(duì)于處理前的每期都進(jìn)行匹配,而每次匹配的結(jié)果可能不盡相同,導(dǎo)致控制組的不穩(wěn)定(即處理組的個(gè)體在不同期與控制組的不同個(gè)體相匹配),也可能引起偏差。

協(xié)變量平均匹配

為了解決控制組的不穩(wěn)定問(wèn)題,一種方法是“協(xié)變量平均匹配”,即將每位個(gè)體在處理前的各期協(xié)變量進(jìn)行平均(類似于組間回歸,即between regression);然后,使用處理前各期協(xié)變量的平均值(已變?yōu)闄M截面數(shù)據(jù))進(jìn)行傾向得分匹配。例如,賈俊雪等(2018,中國(guó)工業(yè)經(jīng)濟(jì))使用1981-2005年的跨國(guó)面板數(shù)據(jù),在研究社會(huì)保障制度的經(jīng)濟(jì)增長(zhǎng)效應(yīng)時(shí),即利用協(xié)變量“1981-1985年(即事前時(shí)點(diǎn))的均值”進(jìn)行傾向得分匹配。

圖片

雖然協(xié)變量平均匹配保證了控制組的穩(wěn)定性,但先將處理前的各期協(xié)變量平均后再進(jìn)行匹配,有可能使得匹配質(zhì)量下降,從而導(dǎo)致偏差。

傾向得分平均匹配

解決控制組不穩(wěn)定問(wèn)題的另一種方法是“傾向得分平均匹配”,即先將處理前的各期分別估計(jì)傾向得分(比如,每期進(jìn)行一個(gè)Logit回歸),然后將處理前各期的傾向得分進(jìn)行平均,并以此作為匹配的標(biāo)準(zhǔn)。例如,張?。?017,經(jīng)濟(jì)學(xué)季刊)使用2005-2013年的縣級(jí)面板數(shù)據(jù),在研究高鐵建設(shè)對(duì)于縣域經(jīng)濟(jì)的作用時(shí),即使用處理前的2005-2009年數(shù)據(jù)分別估計(jì)每年的傾向得分,然后將這5年傾向得分的平均值作為匹配的標(biāo)準(zhǔn)。

圖片

顯然,傾向得分平均匹配可以保證控制組的穩(wěn)定性,但由于將處理前的各期傾向得分進(jìn)行平均,也可能使得匹配質(zhì)量下降,進(jìn)而導(dǎo)致偏差。

傾向得分二階矩匹配

謝申祥等(2021,統(tǒng)計(jì)研究)提出了多期PSM-DID的一種最新方法,在此稱為“傾向得分二階矩匹配”。與傾向得分平均匹配類似,“傾向得分二階矩匹配”也是先將處理前的各期數(shù)據(jù)分別估計(jì)傾向得分,進(jìn)而得到一個(gè)傾向得分的向量(每個(gè)分量對(duì)應(yīng)于處理前的一個(gè)時(shí)期),然后通過(guò)傾向得分向量的二階矩(歐氏距離,即處理前各期傾向得分的平方和之開方),尋找最為接近的控制組個(gè)體作為最合適的匹配,參見下面的論文截圖。

圖片

另外,除了使用傾向得分進(jìn)行匹配外,謝申祥等(2021)還提出針對(duì)某些特殊的“分類變量”(categorical variables),應(yīng)限制將處理組個(gè)體與同類別的控制組個(gè)體進(jìn)行匹配;比如高中生與高中生匹配,而大學(xué)生與大學(xué)生匹配。謝申祥等(2021)的蒙特卡洛模擬表明,傾向得分二階矩匹配的表現(xiàn)良好(比混合匹配與逐期匹配更為穩(wěn)?。?,但也沒(méi)有提供理論上的嚴(yán)格證明。

綜上所述,目前文獻(xiàn)中的多期PSM-DID可謂五花八門,各顯神通,優(yōu)缺點(diǎn)也不盡相同。在缺乏嚴(yán)格計(jì)量理論指導(dǎo)的情況下,實(shí)證研究者只能根據(jù)自己的數(shù)據(jù)特點(diǎn),使用常識(shí)與直覺(jué)選擇最為合適的PSM-DID“野路子”。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多