語言演化與高更三問·第二問 人是何物? 主講人:王士元 美國加州大學(xué)伯克利分校榮休教授 香港理工大學(xué)講座教授 本文是在2018年3月30日華東師范大學(xué)思勉講座上、王士元教授所作報(bào)告的錄音與PPT基礎(chǔ)上整理而成的,略有刪改。 整理:張明輝、袁丹 校訂:蔡雅菁 人是有語言的動(dòng)物 自從人類“站起來”以后,手變得靈活了,喉嚨也得到了改造。如圖1所示,本來我們的喉嚨比較高,當(dāng)直立以后喉嚨就下降了;本來我們的軟腭與喉嚨里的一塊軟骨是相互接觸的,因此是一個(gè)“密閉空間”,但喉嚨下降之后,會(huì)厭部位就形成了一個(gè)“開放空間”,為言語發(fā)聲創(chuàng)造了條件。 圖1. 喉頭下降與語言發(fā)展:猩猩→遠(yuǎn)古人→現(xiàn)代人 下面我想更進(jìn)一步談?wù)劯吒诙枴拔覀兪呛挝铩???dāng)然,我們是有語言的動(dòng)物。而語言又為何物?語言首先是我們溝通交流最重要的工具,同時(shí)也是我們思想/思維最重要的載體和最基本的條件。但在19、20世紀(jì),關(guān)于“語言是怎么來的”一直是學(xué)界一個(gè)諱莫如深的話題,許多人即使長篇大論也難以廓清。因此,當(dāng)時(shí)巴黎、倫敦等語言學(xué)會(huì)便下令會(huì)議期間禁止討論語言起源問題。 圖2. 人類與其他動(dòng)物溝通方式的設(shè)計(jì)特征比較 一直到1960年,美國語言學(xué)家Hockett寫了一篇文章The origin of speech才系統(tǒng)地討論這個(gè)問題 。他指出語言是人類多樣溝通方式中非常獨(dú)特的一種;并提出13種設(shè)計(jì)特征(design features)來說明人類語言的獨(dú)特性:聲耳渠道、四散傳播定向接受、迅速消失、互換性、整體反饋、專門化、語義性、任意性、分離性、跨越時(shí)空、能產(chǎn)性、傳統(tǒng)傳播和模式二重性。同時(shí),如圖2所示,他還比較了人、類人猿、靈長類、陸生哺乳動(dòng)物和爬蟲類的溝通方式所利用的設(shè)計(jì)特征的差異,并強(qiáng)調(diào)只有人類語言涵蓋了全部特征。 其他動(dòng)物的溝通方式 而研究其他動(dòng)物的行為、感知和溝通方式對我們了解智能也很有必要。比如圖3,德國昆蟲學(xué)家Karl von Frisch就率先發(fā)現(xiàn)了蜜蜂的舞蹈語言,即蜜蜂能夠利用∞形舞的頻率與角度傳遞蜜源距離和方向信息:①舞動(dòng)的頻率越高表示蜜源距離越近,反之則越遠(yuǎn);②跳“擺尾舞”時(shí)的中軸線與垂直線的角度,表示太陽與蜜源方向的角度。此外,他還發(fā)現(xiàn)蜜蜂的舞蹈語言存在各種方言,比如小蜜蜂(dwarf honeybee)、巨型蜜蜂(giant honeybee)、印度蜜蜂、澳大利亞蜜蜂和意大利蜜蜂等在表達(dá)同樣的蜜源距離與方位信息上,會(huì)利用不同的舞蹈形狀和時(shí)間節(jié)奏來傳遞。 圖3. 蜜蜂的舞蹈語言與方言 除了von Frisch之外,另外兩位科學(xué)家也在動(dòng)物行為和習(xí)性研究方面作出了卓越的貢獻(xiàn):奧地利動(dòng)物學(xué)家Konrad Lorenz發(fā)現(xiàn)了“小鴨子怎么找媽媽”;荷蘭裔英國動(dòng)物學(xué)家Nikolas Tinbergen發(fā)現(xiàn)了“海鷗怎么分辨自己產(chǎn)的蛋”。因此,von Frisch、Lorenz和Tinbergen共享了1973年的諾貝爾生理學(xué)或醫(yī)學(xué)獎(jiǎng)。 還有一種很有意思的動(dòng)物是鳥。在動(dòng)物之中,除了人之外,鳥也很倚重聲音來溝通交流。伯克利大學(xué)著名的動(dòng)物行為學(xué)家——Peter Marler,經(jīng)常早起、帶著錄音儀器到大學(xué)后面的山上去錄鳥鳴。山上有兩種小鳥:白冠帶鹀(white-crowned sparrow)和北美歌雀(song sparrow)。他想知道這兩種小鳥怎樣學(xué)會(huì)各自屬種的鳴叫,為此,他做了4組不同的實(shí)驗(yàn),如圖4所示。 圖4. 不同刺激輸入環(huán)境下白冠帶鹀的鳴叫習(xí)得 他用控制變量的方法給剛出生的白冠帶鹀輸入a、b、c、d四種不同形式的鳥鳴旋律、并在觀察它們在不同階段的習(xí)得效果:①a組,在前50天感應(yīng)期(sensitive period)輸入白冠帶鹀和北美歌雀的鳴叫聲。②b組,感應(yīng)期內(nèi)只輸入北美歌雀的叫聲;③c組,感應(yīng)期間無聲音輸入;④d組,感應(yīng)期間只輸入白冠帶鹀的叫聲但參與實(shí)驗(yàn)的雄性小白冠帶鹀是只聾鳥。實(shí)驗(yàn)結(jié)果發(fā)現(xiàn):a組的小白冠帶鹀能學(xué)會(huì)自己屬種的鳴叫而不被北美歌雀的聲音干擾;但b、c、d組的卻學(xué)不會(huì)。 由此表明,白冠帶鹀在習(xí)得自己屬種鳴叫的過程中存在時(shí)間限制,正如我們習(xí)得外語的過程中存在“關(guān)鍵期”(critical period)一樣,它們也存在關(guān)鍵期,大約是出生后前50天。此外還有一個(gè)相似之處是,嬰兒在習(xí)得語言之前存在一個(gè)牙牙學(xué)語(bubbling)的階段,雛鳥在習(xí)得特定鳴叫之前也存在一個(gè)吱呀初鳴(subsong)的階段。這再次表明動(dòng)物行為存在很多共同之處。 前文提到,Lorenz曾研究過“小鴨子怎么找媽媽”,他發(fā)現(xiàn)剛出生的小鴨子會(huì)把它所見到的第一個(gè)能動(dòng)的物體當(dāng)成媽媽,這種行為叫“印刻現(xiàn)象”(imprinting)。根據(jù)這一點(diǎn),Lorenz讓剛出生的小鴨子第一眼就看到自己,從而成功充當(dāng)起了它們的“媽媽”,所以他在澳大利亞的田野、街頭行走時(shí)總是有一群小鴨子跟著他,如圖5。 ![]() 圖5. Lorenz利用“印刻現(xiàn)象”充當(dāng)起了小鴨子的“媽媽” 盡管如此,我們對動(dòng)物行為的了解仍然有限。幾乎每幾個(gè)星期就會(huì)有新的、有趣的發(fā)現(xiàn)。比如,曾經(jīng)我們一度認(rèn)為蝙蝠之間沒有溝通,但近年的研究已經(jīng)證實(shí)蝙蝠擁有非常復(fù)雜的、有規(guī)律的溝通系統(tǒng)(Morell,2014) 。這里我們不再做過多的介紹。若有興趣可參看王士元(1991)主編的The Emergence of Language: Development and Evolution ,里面收錄了一些這方面的材料。 ![]() 人類語言的基本特征 ![]() 所以語言到底是有什么樣的特色呢?戰(zhàn)國荀子曾經(jīng)說過:“名無固宜,約之以命,約定俗成謂之宜,異于約則謂之不宜”、“名有固善,徑易而不拂,謂之善名”。這幾句話其實(shí)洞見了語言一個(gè)非?;镜奶卣鳎喝我庑裕╝rbitrariness,這也是前文Hockett提出的13個(gè)設(shè)計(jì)特征之一),即語言符號(hào)的音義結(jié)合關(guān)系是任意的、約定俗成的。 荀子是一個(gè)非常偉大的思想家,王士元(1991)曾經(jīng)寫過一篇文章Language in China: a chapter in the history of linguistics ,里面相當(dāng)一部分討論了荀子的思想。不謀而合,芝加哥大學(xué)的哲學(xué)家Anthony Yu(余國藩,2008)也寫過一篇論文Cratylus and the Xunzi on names ,對荀子的“名”做了更深入的探討。 但語言符號(hào)的音義結(jié)合關(guān)系是否真的是“完全任意”的呢?如圖6所示,有一個(gè)大家都不知道的語言的其中兩個(gè)詞:kiki和booba,它們各自指稱的是左圖還是右圖呢?如果拿這個(gè)圖給不同語言背景的受試者做個(gè)調(diào)查,許多人會(huì)認(rèn)為kiki指稱左圖,booba指稱右圖。所以,音義結(jié)合并非完全任意,它們之間可能存在某種關(guān)系。另外,加州大學(xué)圣地亞哥分校的Ramachandran和Hubbard(2001)也舉了很多例子來說明語音和語義之間的結(jié)合關(guān)系并不是完全任意的 。 ![]() 圖6. 某語言中的兩個(gè)詞“kiki”和“booba”各指何物? 因此,語言的特征并不盡如Hockett提出的13種設(shè)定那樣,有時(shí)候比較復(fù)雜。此外,還有一個(gè)Hockett未曾提及,但也與語言密切相關(guān)的特征,就是“歧義”(ambiguity)。在語言表達(dá)中,如果不聯(lián)系特定背景,經(jīng)常會(huì)產(chǎn)生歧義。比如漢語的一個(gè)句子“雞不吃了”就可以有兩種解讀:“不吃雞了”和“雞不吃東西”,前者將“雞”理解為 “吃”的受事,后者則理解為“吃”的施事。再如另一個(gè)句子“我們沒有做不好的事情”,其兩種歧義表達(dá)和對應(yīng)的句子成分分析可如圖7所示。 ![]() 圖7. “我們沒有做不好的事情”的歧義結(jié)構(gòu)分析 這樣的例子在漢語中不勝枚舉,其他語言亦然。比如英語句子“It’s too hot to eat”中的“it”可以有不同的指稱(食物、天氣、調(diào)料、動(dòng)物……),另外“hot”也有兩個(gè)基本義項(xiàng)“熱”和“辣”;所以組合起來就有好多不同的意思。再比如日語句子“學(xué)生が好きな先生”也有兩個(gè)意思:①喜歡學(xué)生的先生;②學(xué)生喜歡的先生。 當(dāng)然對語言感興趣的不止是語言學(xué)家。例如人工智能領(lǐng)域的開拓者之一、1978年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主Herbert Simon就曾直言:語言一定要等到動(dòng)力系統(tǒng)中不同的功能(如呼吸、發(fā)聲、咀嚼等)交互在一起并同步化(synchronized)才能獲得原動(dòng)力(initial boost),只有這樣我們才能發(fā)出成千上萬區(qū)別性的詞,并且在長段話語中這些詞的發(fā)音能足夠迅速地儲(chǔ)存到我們的工作記憶中。具備了這些條件,我們才能擁有復(fù)雜的思想和精密的語言 (Simon,1962)。王士元(1978)在印度的一次講演中提出了類似主張: “許多這些能力在他種動(dòng)物中也不同程度地存在著(看看黑猩猩使用工具與解決問題的例子)。在人類演化中,這些能力也許比語言更早出現(xiàn),漸漸一步一步地,這些能力在語言精練的過程中越來越為人所運(yùn)用,好像完成了一片片的馬賽克拼貼畫一樣。同樣地,這些能力也被運(yùn)用在其他精細(xì)的人類組織中,特別是在數(shù)學(xué)與音樂方面。” ——W.S-Y. Wang., 1978. Explorations in language evolution. Reprinted on p.116 in Explorations in Language. 總而言之,語言是建立在很多已有的能力上的,因此我覺得類似于“語言是一種特別的器官”這樣的說法是無稽之談。 ![]() 人類和語言的起源:單源or多源? ![]() 討論了語言的一些基本特征后,我們再來談?wù)務(wù)Z言的起源。語言的起源和人類的起源密切相關(guān),但又有不同。兩者在學(xué)界都有兩派觀點(diǎn):單源論(monogenesis)和多源論(polygenesis)。 作為一個(gè)物種,人類的起源更可能是“單源的”: 化石證據(jù)方面,迄今發(fā)現(xiàn)的最早階段的人類化石大多都在非洲(如“少女Lucy”遺?。?;基因證據(jù)方面,目前母系和父系的DNA研究也都支持“非洲起源假說”(The Out of Africa Hypothesis)。 ![]() 圖8. “線粒體夏娃”與非洲起源假說:基于mtDNA比較繪制的人類母系脈絡(luò)譜系樹 圖8展示的是Rebecca Louise Cann的一項(xiàng)研究成果(Cann, Stoneking and Wilson,1987) 。她到醫(yī)院收集了幾百個(gè)胎盤,提取并比較了胎盤中的線粒體(mitochondrial)DNA(下文簡稱“mtDNA”),并繪制了如圖所示的環(huán)形樹。mtDNA存在于細(xì)胞內(nèi)但在細(xì)胞核外,僅包含37個(gè)基因,其結(jié)構(gòu)類型是反映母系脈絡(luò)的重要指標(biāo)。從圖8這棵“樹”上可以看到:140多個(gè)胎盤中,最早分化的7個(gè)全部為非洲裔。這篇文章是第一次從基因角度討論現(xiàn)代人是否起源于非洲的問題。 ![]() 圖9. 基于Y染色體序列變異所繪制的父系脈絡(luò)譜系樹 mtDNA能體現(xiàn)母系遺傳,而Y染色體(Y chromosome)則體現(xiàn)父系遺傳;較之前者,后者的基因要多得多。斯坦福大學(xué)的一組研究人員(Underhill、Shen、Lin等,2000) 就接著比較了Y染色體的序列變異并繪制了如圖9所示的樹形圖,與mtDNA的考察結(jié)果類似,最先分出來的8個(gè)Y染色體全部為非洲裔,這再一次佐證了“非洲起源論”的合理性。在此基礎(chǔ)上,他們首次繪制了全球的人類演化遷徙地圖,如圖10所示。據(jù)此圖可知,大約在10萬年前,現(xiàn)代人從起源地非洲開始四散遷徙,并在不同的時(shí)間到達(dá)不同的區(qū)域。 ![]() 圖10. 人類演化及遷徙路徑地圖 相較于人類的起源,語言的起源則更可能是“多源的”。Freedman和王士元(1996)合著過論文Language Polygenesis: A Probabilistic Model,文中運(yùn)用統(tǒng)計(jì)學(xué)上的泊松模型(Poisson Model)來比較單源和多源的概率,結(jié)果如圖11所示:表征多源的概率曲線(粗線)隨著地點(diǎn)數(shù)期望值的遞增而趨升,因此更支持語言多源論。 ![]() 圖11. 語言起源的“泊松模型”:橫軸為地點(diǎn)數(shù)期望值;縱軸為概率 ![]() 世界語言的譜系 ![]() 但無論語言的起源是單源還是多源,現(xiàn)在世界上大概有六七千種不同的語言,如何將這些語言組織起來并歸類呢?著名語言學(xué)家Greenberg就在語言譜系分類上作出了有益的的嘗試,如圖12所示,他將世界語言分層12個(gè)大語系:克瓦桑語系、尼日爾-剛果語系、尼羅河-撒哈拉語系、德拉威語系、亞非語系、達(dá)羅毗荼語系、卡特維利語系、歐亞語系、得內(nèi)-高加索語系(包括漢藏語)、南方語系、印度洋-太平洋語系、澳大利亞語系和美洲印第安語系。 ![]() 圖12. Greenberg關(guān)于世界語系的劃分圖示 他認(rèn)為世界上為數(shù)眾多的語言都是從這12大語系中發(fā)展出來的。通過觀察同一語系(如得內(nèi)-高加索語)在全球不同地域的分布,也能佐證這些區(qū)域的人類存在親緣關(guān)系。因此語言和化石、基因一樣,也是考察人類親緣譜系關(guān)系的重要證據(jù)。 我認(rèn)為中國語言學(xué)有非常好的傳統(tǒng),從荀子、楊雄到許慎、陳第,都作出了重要的研究。但相對不足的是,我們的眼光總是局限于漢語,而不太關(guān)注語言和語言之間的區(qū)別與聯(lián)系。漢語只是全世界七千多種語言中的一種,我們應(yīng)當(dāng)把視野拓寬,同樣關(guān)注漢語和其他語言之間的關(guān)系。過去在漢語研究領(lǐng)域貢獻(xiàn)卓著的語言學(xué)家中很多都是外國人,我希望不久、也相信不久的將來,中國學(xué)者也能成為某門外語研究領(lǐng)域中的權(quán)威。 下面我將介紹一個(gè)罕見的語言中的例子。圖13所示是有關(guān)斯瓦希里語形態(tài)句法的4個(gè)句子。如果學(xué)過法文、德文或俄文,我們就知道名詞的種類很多,能區(qū)分陰性、陽性甚至中性;并且在使用了某類名詞后,整個(gè)句子的形態(tài)都要表達(dá)該名詞的類別。而斯瓦希里語的名詞種類更加復(fù)雜、多達(dá)八九種,圖13只顯示了其中的第一個(gè)名詞類(前兩句)和第四個(gè)名詞類(后兩句)。 ![]() 圖13. 斯瓦希里語中包含第一與第四類名詞的例句及其單復(fù)數(shù)形態(tài)表達(dá) 在第一個(gè)名詞類的第一句話中, “人”的詞根是tu,“好”是zuri,“一個(gè)”是moja,“那個(gè)”是yule,“摔倒”是meanguka;其中標(biāo)紅的“M m m yu a”皆是與第一類名詞相關(guān)的單數(shù)形態(tài)標(biāo)記。若要表示“兩個(gè)人摔倒”則需以第二句的形式表達(dá);可以看到在復(fù)數(shù)表達(dá)中“M m m yu a”都變成了“wa”, 兩句唯一不同的實(shí)詞是moja(一)和wili(二),其余皆為語法所規(guī)定。而在第四類名詞的兩句話中,單復(fù)數(shù)詞頭就分別變成了ki和vi。我希望將來中國語言學(xué)家也能更多地參與到這些語言的研究中。 前面我們提到了Greenberg對世界語言的劃分,其中有一個(gè)大語系就是歐亞語系。圖14更加具體地顯示了歐亞語系中的分支語系的分布范圍,包括:印歐語、阿爾泰語、韓-日-阿依努語、愛斯基摩-阿留申語、烏拉爾語、吉利亞克語及楚科奇-勘察加語等,其中深藍(lán)色的是印歐語。最后我想梳理一下印歐語及其分支的譜系研究。 ![]() 圖14. 歐亞語系中諸分支語系的分布范圍 西方學(xué)界普遍認(rèn)為現(xiàn)代語言學(xué)發(fā)軔于印歐語的歷史比較研究。英國法官William Jones首次發(fā)現(xiàn)印度梵文和他所熟知的歐洲諸語間(尤其是波斯文、拉丁文和希臘文)存在諸多類似,因此1786年他在一次演說中直言這些語言是同源的。之后一代代學(xué)者繼續(xù)沿著他的道路探索印歐語的親屬關(guān)系及傳遞過程。其中有兩位德國語言學(xué)家August Schleicher和Johannes Schmidt相繼提出了兩大經(jīng)典理論:前者首倡“時(shí)間-縱向傳遞-樹形圖理論”,后者則力主“空間-橫向傳遞-波浪理論”,至今仍有深刻影響。 基于這些研究,我們不但可以用圖15所示的譜系樹來展示從原始印歐語(Proto-Indo-European,簡稱PIE)中派生出來的144種語言及彼此的親緣關(guān)系,還能如圖16所示更進(jìn)一步量化歐洲諸語言的分化時(shí)間(Gray & Atkinson,2003);從該圖可知,歐洲語言的分化時(shí)間大約在5500年以前。 ![]() 圖15. 從原始印歐語派生出來的144種語言及親緣關(guān)系 ![]() 圖16. 歐洲諸語言的分化時(shí)間 而語言譜系關(guān)系的推定及分化時(shí)間的量化,其最主要的依據(jù)就是詞。通過詞形比較即很容易發(fā)現(xiàn)各語言之間的親疏遠(yuǎn)近關(guān)系。圖17羅列了部分印歐語和日語的整數(shù)詞(1~10)。正因?yàn)橛H屬語言間往往具有共同的詞匯、相近的形態(tài)甚至嚴(yán)整的語音對應(yīng)規(guī)律,所以如果能找出這些規(guī)律,就能很好地解釋如何從原始印歐語變化到日耳曼語。 ![]() 圖17. 部分印歐語及日語整數(shù)詞(1~10)的詞形比較 比如德國著名的語言學(xué)家Jacob Grimm就發(fā)現(xiàn)了三類有關(guān)印歐語輔音遞變的現(xiàn)象,被稱為“格林姆定律”(Grimm’s law),這三條規(guī)律能很好地勾勒出“原始印歐語(PIE)→日耳曼語”的演變過程。圖18左列舉了印歐語中部分非日耳曼語和日耳曼語(以英語為例)的幾組同源詞,通過比較這些詞中不同調(diào)音部位(雙唇、齒齦、軟腭)輔音的變化形式來簡示“格林姆定律”的具體涵義: 規(guī)律1:濁送氣音變?yōu)闈岵凰蜌庖?/strong> 規(guī)律2:濁塞音變?yōu)榍迦?/span> 規(guī)律3:清塞音變?yōu)榍宀烈?/strong> ![]() 圖18. 格林姆定律及漢語方言中類似音變的例證 其他語言中也有類似的輔音音變現(xiàn)象。圖18右側(cè)就分別列舉了漢語方言上海話、臺(tái)灣閩南語和香港粵語部分例字的讀音,來依次說明這些方言相對于普通話分別存在d>t、p>f及k>h的音變。 至此,可以對本文做一個(gè)簡單的小結(jié)。我們重點(diǎn)探討了語言演化和高更三問中的第二問“人是何物”,并在人類與其他動(dòng)物溝通方式差異的比較中作出了最關(guān)鍵的回答“人是有語言的動(dòng)物”、“語言是人類最重要的的指標(biāo)”,其后又討論了語言的基本特征、語言的起源與譜系等相關(guān)問題。 第三講“我們向何處去”將討論語言與大腦的關(guān)系,敬請期待! ![]() 參考文獻(xiàn)(部分) ① C. F. Hockett, 1960. The origin of speech, Scientific American 203, pp. 88-96. Reprinted in W. S-Y. Wang, ed. 1982, Human Communication. Language and its Psychobiological Bases. ②V. Morell, 2014. When the bat sings, Science 344 : 1334. ③W. S-Y. Wang (ed.), 1991. The Emergence of Language: Development and Evolution. Scientific American. ④ W.S-Y. Wang, 1989. Language in China: a chapter in the history of linguistics. Journal of Chinese Linguistics 17: pp.183-222. ⑤VS, Ramachandran & EM., Hubbard., 2001. Synaesthesia: A window into perception, thought and language. Journal of Consciousness Studies 8 (12): 3-34 (32). ⑥ R. Cann., M. Stoneking., and A. Wilson., 1987. Mitochondrial DNA and human evolution. Nature 325: 31-36. ⑦ P. A. Underhill, P. Shen, A. Lin, Li Jin, …, M. W. Feldman, L. L. Cavalli-Sforza & P. J. Oefner., 2000. Y chromosome sequence variation & the history of human populations. Nature Genetics 26: pp. 358–361. ⑧ D. A. Freedman, & W.S-Y. Wang., 1996. Language polygenesis: a probabilistic model. Anthropological Science 104. 2. 131-8. ⑨R.D. Gray, Q.D. Atkinson, 2003. Language-tree divergence times support the Anatolian theory of Indo-European origin. Nature 426: 435-9. |
|