馬家窯文化、仰韶文化、磁山文化的地理分布區(qū)域。 圖源:參考文獻3 撰文 | 楊 梟 責(zé)編 | 陳曉雪 一萬年前,歐亞大陸見證了兩大語系的誕生:西方誕生了印歐語系,東方誕生了漢藏語系,如今,世界上超過60%的人口所講的語言均屬于這兩大語系。漢藏語系分布極廣,從太平洋西岸至內(nèi)陸的尼泊爾、巴基斯坦,都有漢藏語系的 “主講人”。然而,漢藏語系在何時何地誕生一直以來都飽受爭議。 4月25日,《知識分子》介紹了復(fù)旦大學(xué)金力團隊的研究 [1]:通過系統(tǒng)發(fā)生學(xué)(phylogenesis)方法,研究人員重構(gòu)了漢藏語系下各個分支的親緣關(guān)系,推算出漢藏語系起源于新石器時期的中國北部,大約5900年前的黃河上游,并且與馬家窯文化和仰韶文化的出現(xiàn)有關(guān)。 短短11天之后,《美國國家科學(xué)院院刊》(PNAS)發(fā)表了一篇相似的研究 [2](下簡稱List團隊的研究)。法國東亞語言研究所、德國馬克斯普朗克人類歷史科學(xué)研究所、巴黎決策數(shù)學(xué)研究所組成的科學(xué)家團隊同樣采用了系統(tǒng)發(fā)生學(xué)的研究方法,得出了相似但不同的結(jié)論:漢藏語系起源于7200年前的中國北部,并與晚期磁山文化和早期仰韶文化相關(guān)。 兩項研究的結(jié)論為何有差異? 首先,兩項研究所采用的數(shù)據(jù)庫不同。在List 團隊的研究中,數(shù)據(jù)庫由該研究的專家構(gòu)建,包含50種漢藏語系的分支語言,每種語言約有180個左右的核心詞匯,同時包含了一千多年前的古代語言,包括上古漢語、古緬語、古藏語以及通過田野調(diào)查收集的現(xiàn)代語言的一手語料。而金力團隊采用的數(shù)據(jù)庫由伯克利大學(xué)的專家構(gòu)建,包括109種分支語言,每種語言大約100個詞,但是不包含方言。 在研究方法上,List 的團隊構(gòu)建并分析了更多種可能發(fā)生的譜系,在所有這些譜系中,僅有33%的譜系表明,漢語最先從整個語系中獨立出來;但是在金力團隊的研究中,漢語總是最先獨立,自成一支。 也就是說,List 團隊對于漢語是否最先獨立并無較大把握,但是金力團隊的研究對此更為確定。另一方面,金力團隊的譜系分析結(jié)合了系統(tǒng)地理分析,從而探討了語言演化的路徑,如下圖;而List等人考慮了更多與馴化物種相關(guān)的詞語。 兩項研究存在諸多差異,因此也得到了不同的結(jié)論,還需要進一步的研究才能確定究竟誰的時間判斷更合理。 “兩個獨立的研究團隊,采用不同來源的語言材料,通過計算得到了相近的語言演化歷史,這是非常不容易的,尤其是在語言學(xué)這個領(lǐng)域內(nèi)。我們雙方的結(jié)論是相互兼容的,也是可以相互驗證的?!?金力告訴《知識分子》。 通過系統(tǒng)地理學(xué)方法,估算漢藏語言原始家園的概率密度。圖源:參考文獻1 新研究的結(jié)論如何得出的? 本研究的作者之一、馬克斯普朗克人類歷史科學(xué)研究所的游涵(Johann-Mattis List)博士告訴《知識分子》,在開展研究工作時,兩個團隊知道彼此的工作,但為了確保獨立性,并沒有查看彼此的研究結(jié)果。 游涵(Johann-Mattis List),馬克斯普朗克人類歷史科學(xué)研究所高級研究員,曾在復(fù)旦大學(xué)交換學(xué)習(xí)。 在這項研究中,List 團隊研發(fā)了一套針對性的標(biāo)注方法,它不僅可以標(biāo)注出具有相同來源的詞,而且可以標(biāo)注哪些音是相互聯(lián)系的。然后,通過運用系統(tǒng)發(fā)生學(xué)方法,推測出它們的歷史關(guān)系,構(gòu)建了它們的譜系。 語言學(xué)界認(rèn)為,語言演化與農(nóng)業(yè)擴張息息相關(guān)。當(dāng)人類進入新石器時代,種植業(yè)和畜牧業(yè)越發(fā)達的部落,其所講語言的地位也會越高。 因此,研究人員特別考察了諸多有關(guān)農(nóng)耕家庭的詞匯,以解釋農(nóng)業(yè)發(fā)展與語言演化的關(guān)系。在他們所構(gòu)建的譜系中,至少六項馴化物種可以找到相對應(yīng)的古詞,包括粟(小米)、豬、綿羊、水稻、牛和馬,如下圖??脊艑W(xué)上,這些物種也的確在當(dāng)時被馴化。粟、豬、綿羊等詞甚至在7200年前就已經(jīng)出現(xiàn)在原始語系中,但最早講漢藏語的祖先,并不知道“水稻”。 這些詞語來源于農(nóng)耕民族,按時間和地點推算,他們屬于晚期磁山文化和早期仰韶文化。與北方起源假說(*)一致,這一語言產(chǎn)生后,主要分化為兩支,東支演化為漢語,而西支則演化出了包括藏語在內(nèi)的多種語言。 公元前1400年(當(dāng)時中國為商朝),漢文字誕生,從此東支漢語的傳播勢不可擋,鄰近地區(qū)的少數(shù)族語很快被同化。而西支則在多樣性上發(fā)展壯大,部分原因在于文字產(chǎn)生的較晚,其分支下最早的藏文、西夏文形成于公元764年和1070年。 語言傳播與對應(yīng)的早期馴化物種。圖源:參考文獻2 語言學(xué)研究的新方法 系統(tǒng)發(fā)生學(xué)(又簡稱譜系學(xué))原本用來研究生物個體的演化歷史,但現(xiàn)在越來越多的學(xué)科采用了這一方法。簡單來講,當(dāng)兩個等位基因出現(xiàn)變異,通過分析它們的特征,向上建立譜系,找到出現(xiàn)變異的根源,這樣逐層建立,得到一個完整的發(fā)生譜系。因為語言演化中也存在譜系,因而越來越多語言學(xué)研究開始采用譜系學(xué)的方法。 “基于語言譜系,結(jié)合群體遺傳學(xué)以及進化生物學(xué)的分析方法,我們可以更有效地估算這些語言的分化年代,并推測分化地點。這對了解語言的歷史,尤其是史前歷史是非常重要的?!苯鹆Ω嬖V《知識分子》。 他同時表示:“國際頂級刊物上連續(xù)發(fā)表兩篇有關(guān)漢藏語系演化的重要文章,也可以反映出國際科學(xué)領(lǐng)域?qū)χ袊Z言學(xué)的歷史研究也是非常的重視。這是一個非常不錯的開端。我們也希望有更多的不同學(xué)科的專家能夠加入到漢藏語系研究的這個行列中?!?/p> List 也抱有相同的期望。“我希望科學(xué)界批判性地看待這些結(jié)果,并試圖改進這項工作?!彼卩]件中回復(fù)道:“我們的數(shù)據(jù)可以自由訪問(https://dighl./sinotibetan/),任何人都可以閱讀并改進我們對詞語關(guān)系的詳細(xì)判斷。” *注:北方起源假說認(rèn)為漢藏語系起源于大約4000-6000年前中國北方[4];與之相對應(yīng)的西南起源假說認(rèn)為,漢藏語系出現(xiàn)在9000年前的中國西南或印度東北部[5]。 參考文獻: 1. Zhang M, Yan S, Pan W, et al. Phylogenetic evidence for Sino-Tibetan origin in northern China in the Late Neolithic[J]. Nature, 2019: 1. 2. Sagart L, Jacques G, Lai Y, et al. Dated language phylogenies shed light on the ancestry of Sino-Tibetan[J]. Proceedings of the National Academy of Sciences, 2019: 201817972. 3. LaPolla R J. The origin and spread of the Sino-Tibetan language family[J]. 2019. 4. LaPolla, R.J. In Areal Diffusion and Genetic Inheritance: Problems in Comparative Linguistics (eds Aikhenvald, A. Y. & Dixon, R. M. W.) 225-254 (Oxford Univ. Press, 2001). 5. van Driem, G. in Trans-Himalayan Linguistics (eds Owen-Smith, T. & Hill, N. W.) 11-40 (de Gruyter, 2014). 制版編輯 | 皮皮魚 |
|