摘要:“因果”是各學(xué)科共同關(guān)心的議題,近年來,大數(shù)據(jù)時代的到來和人工智能領(lǐng)域的發(fā)展使得因果研究受到愈加廣泛的重視。自休謨以來,哲學(xué)家、科學(xué)家從“因果關(guān)系”和“因果機制”兩個層次對因果的概念、理論和方法論展開了激烈的爭論,形成了因果研究的“橫向-縱向”之分野:橫向因果關(guān)系和因果機制強調(diào)結(jié)構(gòu)和事物之間反事實的關(guān)聯(lián);而縱向因果關(guān)系和因果機制強調(diào)生成過程。在當(dāng)前社會科學(xué)研究中,因果分析的橫向與縱向取向各自存在不可替代的優(yōu)點和難以避免的缺陷,唯有破除二元對立,將不同視角、不同范式結(jié)合起來,發(fā)展多元視角下的因果研究才能推動哲學(xué)社會科學(xué)的因果研究走在前沿。 關(guān)鍵詞:橫向因果 縱向因果 計算社會科學(xué) 社會模擬 “因果”自古以來就是人類認識世界時最為關(guān)心的問題,也是各領(lǐng)域科學(xué)研究的核心議題。隨著大數(shù)據(jù)和人工智能時代的到來,為推動強人工智能的實現(xiàn),以統(tǒng)計學(xué)、計算科學(xué)為代表的數(shù)據(jù)科學(xué)領(lǐng)域?qū)?/span>“因果”的定義進行了新一輪的討論,并依托大數(shù)據(jù)和機器學(xué)習(xí)不斷發(fā)展出新的因果分析方法和工具。數(shù)據(jù)科學(xué)中的因果革命浪潮也推動了其他領(lǐng)域?qū)σ蚬麊栴}的探索,研究者們開始重新對“因果”概念、因果分析技術(shù)以及學(xué)科內(nèi)的實證研究進行梳理,產(chǎn)生了一些方法論和研究范式層面的討論和總結(jié),但這些研究和討論主要針對某個具體的議題或?qū)W科,鮮有從理論和方法論角度對整個哲學(xué)和社會科學(xué)領(lǐng)域的因果研究進行一般性的分析。 自休謨(David Hume)以來,哲學(xué)家、科學(xué)家們對什么是“因果”、如何界定“因”和“果”爭論不休,產(chǎn)生了紛繁復(fù)雜的因果理論和方法論。為了更好地應(yīng)對因果革命的潮流,我們需要對“因果”有更全面、更系統(tǒng)的把握。在系統(tǒng)梳理哲學(xué)社會科學(xué)領(lǐng)域有關(guān)因果的理論和研究后,我們發(fā)現(xiàn),“因果”概念包含“因果關(guān)系”和“因果機制”兩個層次,學(xué)者們對因果關(guān)系和因果機制的定義和討論又形成了橫向和縱向兩種視角,基于不同的理論和視角發(fā)展出了不同的因果推論和機制研究方法。本文將首先區(qū)分因果概念的兩個層次,然后介紹因果理論的不同視角,比較不同視角下的因果分析方法,最后談一談如何結(jié)合橫向和縱向視角,推動社會科學(xué)的因果研究走向前沿。 (一)“因果”概念的兩個層次——因果關(guān)系與因果機制 “因果”的概念包含著兩個層次——因果關(guān)系(causation,causal relationship,causes and effects)和因果機制(causal mechanism)。學(xué)術(shù)界關(guān)于“因果”的理論和實證研究也都圍繞著這兩個層次進行。對“因果關(guān)系”的研究稱為“因果推斷”(causal inference),其目的是發(fā)現(xiàn)和界定兩個(或兩種)事件、現(xiàn)象、變量之間是否存在“原因”和“結(jié)果”的關(guān)系,并評估“原因”對于“結(jié)果”的因果效應(yīng)(causal effect)。對“因果機制”的討論叫作機制性的解釋(mechanism based explanation),旨在分析“原因”是如何(通過什么樣的路徑,受到什么樣的調(diào)節(jié),經(jīng)歷了何種過程)引起“結(jié)果”的,重在揭示從原因到結(jié)果的復(fù)雜路徑與過程在厘清因果概念的兩個層次后,我們來回顧當(dāng)前哲學(xué)社會科學(xué)的因果理論如何界定因果關(guān)系和因果機制。 (二)關(guān)聯(lián)性因果關(guān)系和生成性因果關(guān)系 哲學(xué)中不同的因果理論對因果關(guān)系有著不同的定義。Hall將哲學(xué)中關(guān)于因果關(guān)系的理論歸納為關(guān)聯(lián)性和生成性兩種視角。關(guān)聯(lián)性視角(dependence perspective)下的因果關(guān)系理論將因果關(guān)系看作原因和結(jié)果(事件、變量、現(xiàn)象)之間(反事實)的依賴和關(guān)聯(lián)關(guān)系,是一種橫向的(horizontal)視角,著名的因果關(guān)系的規(guī)律理論(regularityviews of causation,RVC)、反事實理論(counterfactualtheories ofcausation)和概率論(probabilistic theories of causation)等都以關(guān)聯(lián)的視角看待因果關(guān)系。 生成性視角(productive perspective)下的因果關(guān)系理論認為因果關(guān)系指的是一個事件(或現(xiàn)象)的發(fā)生能夠引起另一個事件(或現(xiàn)象)的發(fā)生,強調(diào)原因“導(dǎo)致”結(jié)果的過程,是一種縱向的(vertical)視角。哲學(xué)中的干預(yù)主義因果關(guān)系理論等都屬于生成性視角下的因果關(guān)系理論。 因果關(guān)系的哲學(xué)理論為社會科學(xué)界定和推理因果關(guān)系提供了理論基礎(chǔ)和方法論指導(dǎo),在綜合了上述理論的基礎(chǔ)上,社會學(xué)也對因果關(guān)系有著不同的界定。Goldthorpe總結(jié)出社會科學(xué)理解和界定因果關(guān)系的三種方式:(1)穩(wěn)健的相關(guān)(robust dependence):我們?nèi)绻獙?/span>X和Y之間的因果關(guān)系作出論斷,需要證明在控制了所有其他可能影響Y的因素集合Z時,X對Y的影響還存在;(2)重要的干預(yù)(consequential manipulation):也就是說,真實的因果關(guān)系應(yīng)該是當(dāng)原因X被“操縱”之后,在適當(dāng)?shù)目刂葡拢Y(jié)果Y會受到系統(tǒng)性的影響;(3)生成過程(generative process):即我們需要從一個過程中觀察到穩(wěn)定的關(guān)系,才能對因果關(guān)系作出論斷。不難發(fā)現(xiàn),在這幾種看待因果關(guān)系的方式中,“穩(wěn)健的相關(guān)”所采用的是關(guān)聯(lián)性視角,強調(diào)變量之間的穩(wěn)定的關(guān)聯(lián);“重要的干預(yù)”和“生成過程”則以縱向的、生成性視角來看待因果關(guān)系,強調(diào)變化和過程。 (三)橫向因果機制與縱向因果機制 Casini 和Manzo借鑒了Hall的分類體系,以橫向—縱向為坐標,將因果機制理論分為橫向機制和縱向機制兩類。哲學(xué)中,橫向視角下的機制理論將機制看作(將不同部分或成分組織起來的)一種穩(wěn)定的結(jié)構(gòu),橫向機制所討論的因果關(guān)系是關(guān)聯(lián)性視角下的因果關(guān)系。而縱向因果機制所討論的是生成性視角下因果關(guān)系的作用機制,在縱向視角下,機制常常被放在復(fù)雜系統(tǒng)中進行討論:機制包含著實體和行動,這些實體和行動的組織方式?jīng)Q定著它們將以什么樣的方式來產(chǎn)生現(xiàn)象,也就是說在一個由多個不同的個體(或部分、成分等)、個體的行動和個體之間的互動構(gòu)成的復(fù)雜系統(tǒng)中,某一個體的行為(或?qū)傩缘母淖儯┠軌蛞l(fā)其他個體的某種行為(或?qū)傩缘母淖儯?,且個體之間的互動能夠引起系統(tǒng)層面現(xiàn)象或行為的產(chǎn)生,那么機制就是能夠引發(fā)系統(tǒng)現(xiàn)象或行為的互動著的個體之間穩(wěn)健的關(guān)系。 由此可見,因果機制理論的橫向和縱向視角的差異在于,前者強調(diào)穩(wěn)定的結(jié)構(gòu);后者不僅關(guān)注結(jié)構(gòu),更關(guān)注行為與變化的過程:“實體必須處在合適的位置、結(jié)構(gòu)和方向中,實體所參與的行為必須有時間上的順序、速度和時間期限,并且機制對相關(guān)實體、特征和行為的描述需要將它們連在一起來展示實體在某一個階段的行為是如何影響后續(xù)階段的行為的。社會科學(xué)對于橫向和縱向因果機制也有類似的理解。持橫向機制視角的研究者將機制看作變量之間的穩(wěn)健的關(guān)系網(wǎng)絡(luò),而所謂因果機制,就是“原因變量通過一系列變量的中介作用而影響結(jié)果變量”。而持縱向機制視角的社會科學(xué)研究者則認為,統(tǒng)計方法只能描述整體層面的現(xiàn)象,真正的機制需要對微觀個體與宏觀現(xiàn)象之間的關(guān)系作出解釋,因為宏觀的、社會整體層面的現(xiàn)象往往是通過個體行動者的動態(tài)的、非線性的行動和互動而涌現(xiàn)出來的,我們需要還原涌現(xiàn)現(xiàn)象產(chǎn)生的過程才能把握因果機制。 (四)社會科學(xué)研究范式中的橫向與縱向取向 當(dāng)前的社會科學(xué)研究存在三種范式:觀察、實驗和社會模擬。值得一提的是,無論采取哪種范式,若要對“因果性”作出界定必須滿足“反事實”的前提,統(tǒng)計學(xué)和社會科學(xué)對反事實與因果推斷進行了豐富而詳細的討論,在此不再贅述。 觀察研究是社會科學(xué)最常見的研究范式,我們用Y=f[see(X)]的形式來表示。研究者基于由調(diào)查、普查、線上爬取等方式獲得的結(jié)構(gòu)化與非結(jié)構(gòu)化的(靜態(tài)的)觀察數(shù)據(jù),求解自變量X與因變量Y之間的反事實的關(guān)聯(lián)關(guān)系f。 由此可見,觀察研究對因果關(guān)系的界定采取了橫向的、關(guān)聯(lián)性的視角,因果關(guān)系被界定為觀察到的變量之間存在穩(wěn)健的、反事實的關(guān)聯(lián)。在實際研究中,研究者需要借助統(tǒng)計模型來驗證和求解變量之間這種穩(wěn)健的、反事實的關(guān)聯(lián)。在過往的研究中,研究者主要采用潛在結(jié)果框架下常見的傾向性得分分析方法(如匹配、分層和加權(quán))、工具變量方法、內(nèi)生轉(zhuǎn)換模型和因果結(jié)構(gòu)模型框架下的路徑分析、結(jié)構(gòu)方程模型等傳統(tǒng)的統(tǒng)計模型。近年來,隨著機器學(xué)習(xí)的方法向社會科學(xué)領(lǐng)域的滲透,因果樹(causal tree)與因果森林(causal forest)、貝葉斯累加回歸樹(Bayesian additive regressiontrees)、基因匹配(genetic match)、雙重穩(wěn)健方法(double robust method)、廣義提升算法(generalized boosted method)等機器學(xué)習(xí)方法也逐漸被用于社會科學(xué)的因果推斷。 實驗研究(尤其是隨機實驗)被認為是因果推論的黃金準則,可以表示為Y=f[do(X)]。實驗研究在進行因果推論時所采用的是縱向的、生成性的因果關(guān)系視角。在實驗研究中,研究者以控制組作為對比基準,對實驗組的研究對象進行某種干預(yù),觀察當(dāng)改變X時Y如何變化,并與X不變的情況作對比,我們就可以對X和Y之間的因果關(guān)系做出推斷。 由于社會科學(xué)研究的通常是整體層面的現(xiàn)象而不是單獨的個體,所以我們需要對多個研究對象重復(fù)這一過程來判斷這一因果關(guān)系是否有效。因此,需要收集實驗組和控制組在實驗前后的數(shù)據(jù),借助一些統(tǒng)計模型來驗證我們對因果關(guān)系的假設(shè),并從數(shù)量上評估原因?qū)τ诮Y(jié)果的因果效應(yīng)。例如研究者通常借助雙重差分法、斷點回歸等模型來估計某項政策的效果。但由于在現(xiàn)實社會中進行實驗存在著諸多困難與限制,因此實驗研究的范式在社會科學(xué)研究中使用較少。近年來,隨著互聯(lián)網(wǎng)的發(fā)展,線上實驗成為研究者的新的選擇。 觀察研究和實驗研究雖然采取了不同的視角對因果關(guān)系進行推斷,但這兩種范式下的因果機制分析都采用了橫向因果機制的視角,研究者通過在研究中增加中介變量,使用路徑分析、結(jié)構(gòu)方程模型等方法來分析、驗證和估計中介效應(yīng),并用原因變量、中介變量和結(jié)果變量的有向無環(huán)圖(directed acyclic graph,DAG)表示原因?qū)τ诮Y(jié)果的作用機制。 社會模擬的范式以基于多主體的建模(agent based modeling,ABM)為代表,這一范式無論是對因果關(guān)系界定還是對因果機制的分析都采用的是縱向的、生成性的視角,社會模擬與前兩種范式存在較大的差別,我們用Y=f[rule(X)]來表示:其中Y表示我們所要解釋的社會現(xiàn)象,X表示若干個行動者,行動者具有不同的屬性,rule表示行動者的行動以及與其他行動者的互動規(guī)則,我們可以通過模擬來展示出微觀互動是如何涌現(xiàn)出特定的宏觀現(xiàn)象的。在這一過程中,行動者采取的行動和行動者的互動是社會現(xiàn)象產(chǎn)生的原因,而行動者之間的關(guān)系、行動者的行動和互動是如何“一步一步”導(dǎo)致特定現(xiàn)象產(chǎn)生的這一過程便可以作為對特定社會現(xiàn)象產(chǎn)生的機制性的解釋。 但社會模擬的范式在因果推論上存在較大的局限性,因為ABM的參數(shù)完全由研究者設(shè)定,其模型的外部效度——模型在多大程度上能解釋現(xiàn)實社會——常常遭到質(zhì)疑。此外,模擬研究本身存在著模型復(fù)雜度與模型真實性的矛盾,過于簡單的模型常常因遠離現(xiàn)實被批判為思維實驗,過于復(fù)雜的模型雖然更接近現(xiàn)實,但不能幫助我們抽象出因果性的知識。 (五)破除二元對立,發(fā)展多元視角下的因果研究 在當(dāng)前社會科學(xué)研究中,研究者往往采用單一的研究范式來討論因果問題。由于不同的范式所采取的因果視角不同,研究范式間的相互孤立使得社會科學(xué)的因果研究出現(xiàn)橫向和縱向取向的對立。這種對立在對橫向和縱向因果機制的爭論中更為突出。 以Hedstrom等為代表的縱向機制論者猛烈批判橫向機制理論將機制看作變量之間的網(wǎng)絡(luò)關(guān)系的觀點,他們指出,社會學(xué)使用多變量的路徑分析模型的傳統(tǒng)僅僅是將機制作為一種語言上的修辭。Pawson通過對機制的概念進行元理論(meta theoretical)的討論進一步指出,“雖然機制的表達方式可能會在認知上讓我們感覺到是在將量化的變量和我們的理解相聯(lián)系,但是從概念上來說,我們不能將機制等同于變量之間的聯(lián)系,從方法上來說,我們也不能將機制操作化為對一系列干預(yù)變量的統(tǒng)計控制”。 而以Morgan和Winship為代表的橫向因果取向的研究者認為,橫向取向的因果推論和機制分析能夠通過實證分析告訴我們?yōu)槭裁丛蚝徒Y(jié)果之間的反事實相關(guān)關(guān)系存在,且從模型中得出的因果機制是能夠與現(xiàn)實(數(shù)據(jù))對應(yīng)的??v向取向的機制不但不能做到這一點,其本身在概念和方法論上都存在問題:縱向視角對機制的定義非常模糊,如果機制是指一個動態(tài)的復(fù)雜系統(tǒng),其復(fù)雜度可以任意調(diào)整,其參數(shù)有無數(shù)種組合的方式,在這種情況下,我們無法排除能夠引起同樣現(xiàn)象產(chǎn)生的其他機制的存在,也無法對模型所設(shè)定的生成機制進行反事實的驗證。 從以上爭論可以看出,因果研究的橫向和縱向取向都存在不可替代的優(yōu)點和不可避免的缺陷,橫向因果關(guān)系和因果機制能夠通過分析數(shù)據(jù)進行反事實的驗證,但不能體現(xiàn)原因引起結(jié)果的過程;縱向因果能夠展示原因引起結(jié)果的過程,但難以得到現(xiàn)實數(shù)據(jù)的驗證。因此,為了更好地解決因果問題,我們應(yīng)該嘗試在因果分析的過程中將兩種視角結(jié)合起來。幸運的是,隨著統(tǒng)計和計算機模擬技術(shù)的發(fā)展,新的因果推論方法的出現(xiàn)為二者的結(jié)合提供了路徑參考。 第一種路徑是為橫向的因果關(guān)系提供縱向的機制性解釋。也就是說,我們先采用橫向的因果分析方法對因果關(guān)系作出論斷,計算出變量之間的關(guān)系,再使用數(shù)據(jù)驅(qū)動的ABM將實證數(shù)據(jù)和模型的參數(shù)作為ABM模型的初始設(shè)置進行模擬,從而對其因果作用機制提供一個可能的解釋。 第二種路徑是直接在橫向因果分析中納入生成性因果關(guān)系的視角,這一路徑下的典型方法是使用貝葉斯因果圖(Causal Bayesian Networks)。貝葉斯因果圖是因果結(jié)構(gòu)模型中的一種類別,是一種特殊的DAG。如前文所述,DAG以關(guān)聯(lián)性的視角將變量之間(反事實)的關(guān)聯(lián)關(guān)系作為因果關(guān)系,以橫向的視角將變量之間的關(guān)系網(wǎng)絡(luò)作為因果機制。和一般的DAG不同的是,貝葉斯因果圖使用Do算子(Do calculus)來對變量之間的關(guān)系進行反事實的推理,而Do算子在進行運算時采用數(shù)值模擬的方式對變量進行“干預(yù)”:對原因變量的數(shù)值進行改變,從而觀察原因變量的改變?nèi)绾我鸾Y(jié)果變量的變化;并且由于在對每個變量進行干預(yù)時都會切斷指向該變量的其他連邊,因此在對一個變量進行操作時,整體的網(wǎng)絡(luò)結(jié)構(gòu)不會發(fā)生改變。這一巧妙的設(shè)計使得貝葉斯因果圖既能夠在關(guān)聯(lián)性的因果關(guān)系中體現(xiàn)出生成性,也能保證因果機制的穩(wěn)定性和可驗證性。 但橫向與縱向取向的因果分析相結(jié)合的這兩種路徑目前尚處于發(fā)展階段,已有的方法還只適合做理論驅(qū)動的、驗證性的因果分析,依賴于研究者首先對因果關(guān)系和因果機制提出假設(shè),再使用模型對假設(shè)進行驗證和模擬。但人腦所思考的維度是有限的,正如拉姆斯菲爾德(Donald Rumsfeld)所言,“There are known unknowns, but there are alsounknown unknowns”。目前,統(tǒng)計學(xué)、計算科學(xué)、系統(tǒng)科學(xué)、人工智能等領(lǐng)域正在探索數(shù)據(jù)驅(qū)動的因果發(fā)現(xiàn)方法,作為社會科學(xué)的研究者,我們應(yīng)不斷將這些新的思想和方法整合進社會科學(xué)的因果研究框架中,從而推動哲學(xué)社會科學(xué)的因果研究走在前沿。 ( (本文作者:梁玉成 中山大學(xué)社會學(xué)與社會工作系教授;賈小雙 中山大學(xué)社會學(xué)與社會工作系博士生) |
|