日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

大數(shù)據(jù)經(jīng)驗(yàn)主義

 陽子玉 2015-12-15


作者簡介:齊磊磊,華南理工大學(xué)科學(xué)技術(shù)哲學(xué)研究中心

原發(fā)信息:《哲學(xué)動(dòng)態(tài)》(京)2015年第20157期 第89-95頁


內(nèi)容提要:

大數(shù)據(jù)時(shí)代的領(lǐng)軍人物的諸多觀點(diǎn)與經(jīng)驗(yàn)主義、邏輯經(jīng)驗(yàn)主義,尤其是南茜·卡特萊特倡導(dǎo)的新經(jīng)驗(yàn)主義的觀點(diǎn)極其相似。比如說,他們認(rèn)為基本定律是不存在的、大數(shù)據(jù)時(shí)代不需要理論;大數(shù)據(jù)時(shí)代相關(guān)性替代了因果性;世界是斑雜的,大數(shù)據(jù)時(shí)代世界的本質(zhì)是數(shù)據(jù),是混亂的。我們不否認(rèn)大數(shù)據(jù)方法論,并認(rèn)為數(shù)據(jù)和大數(shù)據(jù)在科學(xué)與日常生活中扮演著重要的作用,但并不贊同大數(shù)據(jù)經(jīng)驗(yàn)主義對大數(shù)據(jù)神化的觀點(diǎn)。


  為了分析大數(shù)據(jù)經(jīng)驗(yàn)主義,本文首先說明經(jīng)驗(yàn)主義的含義。所謂經(jīng)驗(yàn)主義,就是這樣的一種哲學(xué)觀點(diǎn):所有的概念都起源于經(jīng)驗(yàn);所有的概念要在經(jīng)驗(yàn)中被證實(shí)地認(rèn)識(shí)到。①也就是說,一切知識(shí)都是“后驗(yàn)”(a posteriori)的,除了從經(jīng)驗(yàn)上認(rèn)識(shí)的和從經(jīng)驗(yàn)上歸納出來的東西之外,其他的知識(shí)都不是科學(xué)知識(shí),只是思辨的形而上學(xué),這種立場叫作經(jīng)驗(yàn)主義立場,16世紀(jì)、17世紀(jì)的洛克、牛頓、貝克萊、休謨都堅(jiān)持這種觀點(diǎn)。邏輯經(jīng)驗(yàn)主義也堅(jiān)持這種觀點(diǎn):科學(xué)理論和定律的唯一的認(rèn)識(shí)論來源就是觀察和經(jīng)驗(yàn),所以科學(xué)的語詞和命題,必須是經(jīng)驗(yàn)地可證實(shí)的,否則就是沒有意義的,應(yīng)作為形而上學(xué)加以拒斥。他們的創(chuàng)始人卡爾納普說:“任何一個(gè)詞的意義就在于知道它的經(jīng)驗(yàn)標(biāo)準(zhǔn),能從觀察記錄句子中將它推出?!雹诙锟苏f:“一個(gè)命題的意義就是(經(jīng)驗(yàn)地)證實(shí)它的方法。”③但是事實(shí)上,理論的語言T(質(zhì)點(diǎn)、原子、分子運(yùn)動(dòng)、引力等等)沒有直接的觀察經(jīng)驗(yàn)或觀察語言與它相對應(yīng),所以邏輯經(jīng)驗(yàn)主義要求必須有個(gè)橋接原理(bridge principle)或?qū)?yīng)原則(corresponding principle),記作C,將T與一組經(jīng)驗(yàn)語言對應(yīng)起來,使這組經(jīng)驗(yàn)語言與理論語言共外延,因此理論結(jié)構(gòu)就是TC。邏輯經(jīng)驗(yàn)主義之所以是“邏輯”的,因?yàn)樗幸惶走壿嫹治龅姆椒?,來說明這種經(jīng)驗(yàn)的結(jié)構(gòu)。但橋接原理是很難找到的,并且常常出現(xiàn)不同概念的“異質(zhì)混淆”。例如“質(zhì)量”這種東西就有很多方法局部地證實(shí)它:用彈簧秤來稱它;用肩膀來扛它;用物體來碰它。這些不同方法是異質(zhì)的,怎能混淆在一起與質(zhì)量這個(gè)概念共外延?于是邏輯經(jīng)驗(yàn)主義便陷入困境。

  在邏輯經(jīng)驗(yàn)主義被推翻之后,興起了一場關(guān)于實(shí)在論與反實(shí)在論的討論。中心問題是科學(xué)的理論實(shí)體和理論定律是用來指稱客觀實(shí)在的實(shí)體和關(guān)系,還是僅僅為了“拯救現(xiàn)象”?在這場論戰(zhàn)中,出現(xiàn)了一種以南茜·卡特萊特(Nancy Cartwright)為首的新經(jīng)驗(yàn)主義的觀點(diǎn)和新哲學(xué)運(yùn)動(dòng),想要說明科學(xué)實(shí)際上是怎樣工作的,它與世界的關(guān)系如何。他們認(rèn)為:(1)所有的物理學(xué)的基本定律,都是非常特殊的人為的“律則機(jī)器”(nomological machines)④制作出來的,即在極特殊的人工創(chuàng)造的實(shí)驗(yàn)室條件下將它制作出來的,因而都不是真的和普遍的。卡特萊特的《物理定律是如何撒謊的》(1983)主要論證了這個(gè)觀點(diǎn)。(2)因此,基本物理定律不能應(yīng)用于現(xiàn)實(shí)世界的對象。例如誰能用萬有定律來解釋或預(yù)言屋頂上一張鈔票會(huì)飛落到哪里去呢?(3)這樣看來,世界是斑雜的,“自然界中大多數(shù)發(fā)生的事是碰巧發(fā)生的,完全不受制于定律”⑤。(4)所以國家不應(yīng)將大量財(cái)政資金用到基本物理學(xué)的研究上,例如不應(yīng)將100億美元用到建設(shè)核物理的大型強(qiáng)子對撞機(jī)上。新經(jīng)驗(yàn)主義者的這些觀點(diǎn)得到許多學(xué)者的擁護(hù),中國也有一些科學(xué)哲學(xué)研究者認(rèn)可這些觀點(diǎn),并進(jìn)行分析研究。

  大數(shù)據(jù)經(jīng)驗(yàn)主義隨著大數(shù)據(jù)方法的興起而興起。數(shù)據(jù)(data)一詞本來有大量資料、海量數(shù)據(jù)的意思,最先經(jīng)歷信息爆炸的學(xué)科(如天文學(xué)和基因?qū)W)創(chuàng)造出了“大數(shù)據(jù)”(big data)這個(gè)概念。大數(shù)據(jù)指的是一般的軟件工具難以捕捉、管理和分析的大容量數(shù)據(jù),一般以“太字節(jié)”為單位?!按髷?shù)據(jù)”之“大”,并不僅僅在于“容量之大”,更大的意義在于:通過對海量數(shù)據(jù)的交換、整合和分析,發(fā)現(xiàn)新的知識(shí),創(chuàng)造新的價(jià)值,帶來“大知識(shí)”、“大科技”、“大利潤”和“大發(fā)展”⑥。從哲學(xué)的角度看,這種意義上的大數(shù)據(jù)可以被看成經(jīng)驗(yàn)大數(shù)據(jù)。根據(jù)這樣的梳理,像維克托·邁耶-舍恩伯格(Viktor Mayer-Sch nberger)那樣最受人尊敬的大數(shù)據(jù)權(quán)威發(fā)言人,以及像《連線》雜志主編安德森(C.Anderson)這樣的人物,過于夸大了大數(shù)據(jù)方法論中經(jīng)驗(yàn)數(shù)據(jù)在科學(xué)與實(shí)踐中的作用,貶低甚至抹殺了理論、定律以及因果性的作用,這樣的思路與卡特萊特為首的新經(jīng)驗(yàn)主義極其相似,因此本文將其稱為大數(shù)據(jù)經(jīng)驗(yàn)主義。大數(shù)據(jù)經(jīng)驗(yàn)主義的基本論點(diǎn)可概括為三個(gè):(1)大數(shù)據(jù)時(shí)代“理論終結(jié)了”;(2)大數(shù)據(jù)時(shí)代,因果性不存在了,由相關(guān)性來代替;(3)世界的本質(zhì)是混亂的,但又是數(shù)據(jù)的。

  一 大數(shù)據(jù)時(shí)代“理論終結(jié)了”嗎?

  2008年,安德森指出,“數(shù)據(jù)爆炸使得科學(xué)的研究方法都落伍了”⑦。大量的數(shù)據(jù)從某種程度上意味著“理論的終結(jié)”。他還提出,用一系列的因果關(guān)系來驗(yàn)證各種猜想的傳統(tǒng)研究范式已經(jīng)不實(shí)用了,如今它已經(jīng)被無需理論指導(dǎo)的純粹的相關(guān)關(guān)系研究所取代。

  為了支撐自己的觀點(diǎn),安德森闡述了量子物理學(xué)已變成一門純理論學(xué)科,量子物理學(xué)的理論已脫離實(shí)際。他提到了谷歌的搜索引擎和基因排序工程,他認(rèn)為:“現(xiàn)在已經(jīng)是一個(gè)有海量數(shù)據(jù)的時(shí)代,應(yīng)用數(shù)學(xué)已經(jīng)取代了其他的所有學(xué)科工具。而且只要數(shù)據(jù)足夠,就能夠說明問題。如果你有一拍字節(jié)的數(shù)據(jù),只要掌握了這些數(shù)據(jù)之間的相關(guān)關(guān)系,一切就都迎刃而解了。”⑧舍恩伯格也有相同的觀點(diǎn):“我們一直都是把理論應(yīng)用到實(shí)踐中來分析和理解世界,而如今處在大數(shù)據(jù)時(shí)代下,我們不再需要理論了,只要關(guān)注數(shù)據(jù)就足夠了。這就意味著所有的普遍規(guī)則都不重要了,比方說世界的運(yùn)作、人類的行為、顧客買什么東西什么時(shí)候會(huì)壞等。如今,重要的就是數(shù)據(jù)分析,它可以揭示一切問題?!雹?/p>

  這種觀點(diǎn),隨著大數(shù)據(jù)方法一起很快傳入中國。在2014年1月由黑龍江大學(xué)主辦的“大數(shù)據(jù)時(shí)代的哲學(xué)問題學(xué)術(shù)研討會(huì)”上,哈爾濱理工大學(xué)孫博文教授曾在會(huì)議報(bào)告中提到:所謂大數(shù)據(jù),可以將其定義為大量的、靜態(tài)的、離散的人造資料,它本身無價(jià)值,它的價(jià)值是人的需求賦予的,是人為構(gòu)造的規(guī)則將有趣的數(shù)據(jù)分離出來,于是可以說有一種規(guī)則就會(huì)有一種規(guī)律……而我們所謂被發(fā)現(xiàn)的規(guī)律也就是獨(dú)一無二的了。需求創(chuàng)建規(guī)則,將現(xiàn)象分類與連接,有效的規(guī)則便創(chuàng)造了一種有效的規(guī)律,科學(xué)就是根據(jù)需求創(chuàng)建規(guī)則,并獲得規(guī)律的學(xué)問。因此,人類追求客觀真理,只是一種虛幻的自我陶醉而已。⑩

  經(jīng)驗(yàn)大數(shù)據(jù)可以完全替代理論嗎?它真的是人們?yōu)榱诵枰斯?chuàng)造出來的嗎?我們可以從大數(shù)據(jù)方法論本身和大數(shù)據(jù)在科學(xué)中的應(yīng)用這兩個(gè)方面來分析這個(gè)問題。

  一方面,從處理大數(shù)據(jù)的方法論來說,涂子沛在《大數(shù)據(jù)》一書中分析了處理大數(shù)據(jù)的整個(gè)過程:(1)首先需要有一個(gè)“運(yùn)營式信息系統(tǒng)”,數(shù)據(jù)在其中的作用,“是一個(gè)個(gè)商務(wù)流程的記錄”。(11)彼得·德魯克(Peter Drucker)談到大數(shù)據(jù)方法的這一階段時(shí)說:“迄今為止,我們的系統(tǒng)產(chǎn)生的還僅僅是數(shù)據(jù),而不是信息,更不是知識(shí)!”(12)(2)有了記錄一切的數(shù)據(jù),還必須有一個(gè)“數(shù)據(jù)倉庫”。它是一個(gè)面向主題的以數(shù)據(jù)分析為基礎(chǔ),以決策支持為目的的數(shù)據(jù)收集、分類和整理的物理構(gòu)架。這里,要進(jìn)行分類就需要各種不同的維度,如要研究一個(gè)公司的銷售量就需要“時(shí)間”、“產(chǎn)品類別”、“地區(qū)”、“銷售數(shù)量”等維度。由于工商業(yè)的發(fā)展,這個(gè)分析維度可以有上萬個(gè)維度,它們起到聯(lián)機(jī)分析的作用。你需要從倉庫中獲得什么類別的資料數(shù)據(jù),設(shè)計(jì)好數(shù)據(jù)倉庫,只要鼠標(biāo)一點(diǎn)就可以列出動(dòng)態(tài)報(bào)表。筆者認(rèn)為,在這里我們需要區(qū)分主觀的目標(biāo)和客觀的資料。分類框架的設(shè)計(jì)和鼠標(biāo)點(diǎn)擊選擇是有目的和意向的,但維度和數(shù)據(jù)本身是客觀的,事物的量的特征,不能任意創(chuàng)造的。(3)進(jìn)一步地,決策支持系統(tǒng)的數(shù)據(jù)需要“數(shù)據(jù)挖掘”(基于數(shù)據(jù)庫的知識(shí)發(fā)現(xiàn))。例如,沃爾瑪是世界上最大的零售商,擁有世界上數(shù)一數(shù)二的數(shù)據(jù)倉庫。在一次例行的數(shù)據(jù)分析之后,研究人員突然發(fā)現(xiàn):尿布和啤酒的銷售量有一種正比例的相關(guān)性。這就發(fā)現(xiàn)了一個(gè)有用的“規(guī)律”。它是客觀存在的,不是“需要?jiǎng)?chuàng)建出來的”,而是需要使我們發(fā)現(xiàn)了它。它也不是獨(dú)一無二的,而是適用于所有具有同樣情況的消費(fèi)關(guān)系。(4)數(shù)據(jù)可視化。它就是將“數(shù)據(jù)倉庫”的數(shù)據(jù)分析和聯(lián)機(jī)分析以及數(shù)據(jù)挖掘的結(jié)果在計(jì)算機(jī)中自動(dòng)生成圖表,給人們一種直觀的數(shù)字思維。

  這是已經(jīng)列出的大數(shù)據(jù)方法論的主要梗概,從中可以看出,“科學(xué)始于人造資料”、“需要?jiǎng)?chuàng)建了規(guī)律”是一種夸張的表達(dá)方式。這里有兩個(gè)問題:其一,不論你怎樣選擇、分類和利用它,大數(shù)據(jù)本身是不是客觀物理事件和客觀經(jīng)濟(jì)運(yùn)作的反映或表征,大數(shù)據(jù)是關(guān)于什么對象的大數(shù)據(jù)?它不是關(guān)于決策者想象力和創(chuàng)造力的大數(shù)據(jù),而是我們所要研究的客觀對象的大數(shù)據(jù),這不是虛幻的自我陶醉。其二,海量數(shù)據(jù)本身不會(huì)對決策產(chǎn)生影響,首要的問題是運(yùn)用數(shù)據(jù)的意向性和由此對數(shù)據(jù)進(jìn)行分類。不同的意向性或者目的性以及不同的分類體系是由選定的概念決定的,這些都離不開一套理論體系。所以從大數(shù)據(jù)方法論來看,理論不是可有可無的。大數(shù)據(jù)時(shí)代不再需要理論嗎?完全不是這么回事!大數(shù)據(jù)的取得和分析不但需要計(jì)算機(jī)科學(xué),而且還需要復(fù)雜性科學(xué)。蓋爾曼是復(fù)雜適應(yīng)系統(tǒng)理論的創(chuàng)始人之一,他在討論復(fù)雜適應(yīng)系統(tǒng)時(shí)每次都加上規(guī)律性或普遍原理一詞。他說:“復(fù)雜性科學(xué)是研究潛在于各種復(fù)雜系統(tǒng)的‘一般原理’及其具體表現(xiàn)的科學(xué)?!?13)霍金認(rèn)為,21世紀(jì)的主導(dǎo)科學(xué)是復(fù)雜性科學(xué)。沒有普遍規(guī)則,普遍定律能構(gòu)造一門學(xué)科嗎?今天,大數(shù)據(jù)方法之所以能起到如此重要的作用,究其根源都來自這些復(fù)雜性科學(xué)、計(jì)算機(jī)科學(xué)和網(wǎng)絡(luò)科學(xué)的理論和定律。怎么會(huì)不要理論和原理呢?

  另一方面,我們看大數(shù)據(jù)對發(fā)現(xiàn)現(xiàn)代科學(xué)理論的新事實(shí)和檢驗(yàn)科學(xué)理論的作用。當(dāng)代物理學(xué)最前沿的理論是量子場論中基本粒子及其相互作用力的理論,它關(guān)系到我們宇宙的起源問題,被稱為粒子物理學(xué)中的標(biāo)準(zhǔn)模型。這個(gè)理論的形成與發(fā)展需要證實(shí)它所預(yù)言的一種稱為希格斯玻色子,它自旋為零,不帶電荷,物質(zhì)之所以有質(zhì)量都因?yàn)槠渲械幕玖W优c它耦合而得來,這種粒子和它的場發(fā)生于宇宙大爆炸后的一億分之一秒間。物理學(xué)家花了40年的時(shí)間都沒有找到它。世界上最大的、最昂貴的大型強(qiáng)子對撞機(jī)建立的目的之一就是為了找到它。大型強(qiáng)子對撞機(jī)每天實(shí)驗(yàn)將產(chǎn)生相當(dāng)于500垓字節(jié)(5×10[20])的數(shù)據(jù),是全世界所有數(shù)據(jù)源總和的200倍。只有這樣大的數(shù)據(jù)才能發(fā)現(xiàn)難于發(fā)現(xiàn)的基本粒子。2012年7月4日,歐洲研究組織(CERN)向世界宣布,找到了這種粒子,這使基本粒子物理學(xué)前進(jìn)了一大步。所以說,大數(shù)據(jù)使“量子物理已經(jīng)脫離實(shí)際”,進(jìn)而使科學(xué)理論走向終結(jié)是完全沒有根據(jù)的。大數(shù)據(jù)不但沒有終結(jié)科學(xué)理論,而且因?yàn)橛懈?、更新、更?zhǔn)確的實(shí)驗(yàn)數(shù)據(jù)從而使科學(xué)理論大大向前發(fā)展了。由于發(fā)現(xiàn)這種被稱為“上帝粒子”的希格斯玻色子,歐美的許多物理學(xué)家徹夜狂歡,慶祝物理學(xué)的勝利,這也是慶祝大數(shù)據(jù)的勝利。所以大數(shù)據(jù)并沒有使“理論終結(jié)”而是使量子物理向前推進(jìn)了一大步。對于這個(gè)發(fā)現(xiàn)有人高興有人愁,愁的是根據(jù)理論計(jì)算,我們發(fā)現(xiàn)的希格斯玻色子只是希格斯場的一種形態(tài),希格斯場還有第二種狀態(tài),比我們現(xiàn)在觀察的希格斯場的密度要高出幾十億倍,物理學(xué)家期望計(jì)劃今年實(shí)現(xiàn)的歐洲核子研究中心大型強(qiáng)子對撞機(jī)將碰撞的質(zhì)子能量翻倍,用更強(qiáng)烈的質(zhì)子碰撞,更大的大數(shù)據(jù)使我們進(jìn)一步探索粒子新世界,使我們有可能知道,為什么希格斯玻色子的能量如此特殊?為什么它能正好讓我們的宇宙平衡在發(fā)生相位的臨界點(diǎn)?而我們的宇宙為什么可能是許許多多宇宙中的很幸運(yùn)的一個(gè)。從理性的觀點(diǎn)看,詢問為什么的問題,比詢問過程是怎樣進(jìn)行的更重要、更有吸引力。

  二 因果性不存在,由相關(guān)性來代替嗎?

  舍恩伯格認(rèn)為,在大數(shù)據(jù)時(shí)代,相關(guān)關(guān)系分析為我們提供了一系列新的視野和有用的預(yù)測,我們看到了很多以前不曾注意到的聯(lián)系,還掌握了以前無法理解的復(fù)雜技術(shù)和社會(huì)動(dòng)態(tài)。但最重要的是,通過探求“是什么”,而不是“為什么”,相關(guān)關(guān)系幫助我們更好地了解了這個(gè)世界。(14)所以,在他看來,知道“是什么”就夠了,沒必要知道“為什么”。在大數(shù)據(jù)時(shí)代,我們不必非得知道現(xiàn)象背后的原因,而是要讓數(shù)據(jù)自己“發(fā)聲”(15)。進(jìn)而他又提出:“相關(guān)關(guān)系的核心是量化兩個(gè)數(shù)據(jù)值之間的數(shù)理關(guān)系。相關(guān)關(guān)系強(qiáng)是指當(dāng)一個(gè)數(shù)據(jù)值增加時(shí),另一個(gè)數(shù)據(jù)值很有可能也會(huì)隨之增加。(16)……相反,相關(guān)關(guān)系弱就意味著當(dāng)一個(gè)數(shù)據(jù)值增加時(shí),另一個(gè)數(shù)據(jù)值幾乎不會(huì)發(fā)生變化。例如,我們可以尋找關(guān)于個(gè)人的鞋碼與幸福的相關(guān)關(guān)系,但會(huì)發(fā)現(xiàn)它們幾乎扯不上什么關(guān)系。”(17)相關(guān)性真的可以替代因果性嗎?

  因果與相關(guān)(causality and correlation,在物理學(xué)中后者常譯成關(guān)聯(lián)),本來是哲學(xué)上的老問題,它們是同時(shí)存在又相互交叉、彼此又有區(qū)別的概念,一直纏繞著哲學(xué)家、數(shù)學(xué)家、統(tǒng)計(jì)學(xué)家和物理學(xué)家們。黑夜過去就是白天,黑夜和白天只有相關(guān),沒有因果關(guān)系。詩人說,“冬天到了,春天還會(huì)遠(yuǎn)嗎”,春天與冬天也只有相關(guān),而沒有因果關(guān)系。這是日常生活中的事件之間的相關(guān),而不是因果關(guān)系。如果追究真正的原因,黑夜與白天交替是地球的自轉(zhuǎn),春冬季節(jié)更替是地球的公轉(zhuǎn)。

  所以,相關(guān)性是一種比因果性更廣泛的概念。從數(shù)學(xué)上看,在集合論中,相關(guān)性不過是兩個(gè)集合或多個(gè)集合組成元素之間的“有序?qū)Α?,或通俗說來,是一些對應(yīng)關(guān)系:多一對應(yīng)、一多對應(yīng)或一一對應(yīng)的關(guān)系,它完全沒有因果作用的含義。函數(shù)關(guān)系也是在這基礎(chǔ)上進(jìn)行定義的,“自變量”在數(shù)學(xué)上并沒有原因的意思,“因變量”即函數(shù)也沒有結(jié)果的意思。而因果關(guān)系或因果作用比一般的相關(guān)性進(jìn)了一步,它要求揭示事物之間、個(gè)體元素之間、性質(zhì)之間的機(jī)制作用和動(dòng)力。所以,基本的解釋進(jìn)路是用因果解釋相關(guān),而不是用相關(guān)解釋因果。由于因果關(guān)系在哲學(xué)上是很古老的概念,而函數(shù)的相關(guān)關(guān)系則是比較新的。所以,1913年羅素曾嘗試用函數(shù)的概念代替因果概念。他說:“我相信符合哲學(xué)家要求的因果律是一個(gè)逝去時(shí)代的遺留物,就像君主政體一樣,它的存在只因?yàn)槿藗冨e(cuò)誤地認(rèn)為它是無害的……老因果律之所以長期保留在哲學(xué)家的書本中,那是因?yàn)樗麄兇蠖鄶?shù)人對函數(shù)概念不熟悉?!?18)不過,1948年羅素還是放棄了用函數(shù)代替因果這個(gè)拒斥形而上學(xué)的觀點(diǎn),提出了很有分量的“因果過程”或“因果線”的概念以及因果線交叉而發(fā)生“因果作用”的概念(本文下面部分會(huì)分析它的重要性)。其實(shí),17世紀(jì)的老經(jīng)驗(yàn)主義者休謨早就堅(jiān)決反對用看不見摸不著的“能力”(power)、“力量”(force)或“必然性”這些“形而上學(xué)”的本體論概念來說明因果。他將因果性僅定義為原因C在結(jié)果E之先,C與E有接觸,C與E有恒常結(jié)合。事實(shí)上,是用一種無因果力作用的相關(guān)概念來定義因果。而步休謨、早期羅素的后塵,邏輯經(jīng)驗(yàn)論也只將因果性定義為條件之間的邏輯關(guān)系,將真正的因果作用拋得遠(yuǎn)遠(yuǎn)的。這可以看作哲學(xué)上的相關(guān)概念壓倒因果作用的早期相關(guān)觀念。但是自從邏輯經(jīng)驗(yàn)論垮臺(tái)之后,赫勒和馬頓(1975)、邦格(1983)、薩爾蒙(1984)、羅素后期(1948)基本上將因果關(guān)系看作物質(zhì)、能量、信息(或他們所說的作用力、守恒量)的傳遞與轉(zhuǎn)移。傳遞者是原因,被傳遞者由此發(fā)生的變化是結(jié)果,它發(fā)生在因果線之間的交叉點(diǎn)上;而其他的相關(guān)或關(guān)聯(lián)關(guān)系則稱作非因果相關(guān)。現(xiàn)在這個(gè)階段,在哲學(xué)上是因果力相關(guān)相對一般相關(guān)占優(yōu)勢的時(shí)期,恢復(fù)了用因果解釋一般相關(guān)的基本觀念。在這個(gè)時(shí)期,哲學(xué)家和統(tǒng)計(jì)學(xué)家研究了統(tǒng)計(jì)相關(guān)、統(tǒng)計(jì)因果。統(tǒng)計(jì)上概率大的事物并不是因?yàn)樗臄?shù)據(jù)大,它就能成為確定的因果力,只是說明它包含真正原因的可能性比較大。關(guān)于統(tǒng)計(jì)相關(guān)與因果作用的關(guān)系,有許多不同的理論,這不是本文所能討論的。取其中最簡單的公式,它是由阿姆斯特朗(D.M.Armstrong)和蘇佩斯(P.Suppes)提出來的:所謂統(tǒng)計(jì)正相關(guān)關(guān)系是“因果關(guān)系將會(huì)發(fā)生的概率”(19),這種統(tǒng)計(jì)正相關(guān)表明,C成為E的原因的可能性有多大。所以,正相關(guān)為Pr(E/C)>Pr(E)或Pr(E/C)>Pr(E|﹁C),則C是E的原因的可能性等于Pr(E/C)。例如,一個(gè)婦女超過預(yù)產(chǎn)期還未生產(chǎn),則有可能流產(chǎn)(E),但是只有千分之一的可能性,即Pr(E/C)=0.1%。所以,醫(yī)生建議產(chǎn)婦引產(chǎn)一般被拒絕,這是C成為E的原因的一個(gè)置信度(從概率的主觀解釋看)或傾向性(從概率的客觀解釋看)的問題。許多大事件,例如飛機(jī)失事,都是通過統(tǒng)計(jì)相關(guān)來看清事件的真正原因,所以它仍然立足于以物質(zhì)、能量、信息傳遞這個(gè)真正原因來解釋統(tǒng)計(jì)相關(guān)。某次飛機(jī)失事了,人們不會(huì)說,根據(jù)大數(shù)據(jù),這是統(tǒng)計(jì)相關(guān),因?yàn)檫@個(gè)型號(hào)的飛機(jī)有千分之一的失事率,那就不必找黑箱查原因了。

  從量子物理學(xué)看,20世紀(jì)70年代末科學(xué)上著名的“量子糾纏”這個(gè)范例,它成了愛因斯坦與玻爾爭論量子力學(xué)完備性的一個(gè)焦點(diǎn),因貝爾不等式和EPR的實(shí)驗(yàn),量子力學(xué)保衛(wèi)了自己的完備性,同時(shí)愛因斯坦學(xué)派又繼續(xù)堅(jiān)持了相對論和光速是速度極限的觀點(diǎn)。

  “量子糾纏”,通俗地說是這樣一個(gè)問題:假設(shè)兩個(gè)粒子在短暫時(shí)間里有過耦合,隨后,它們彼此分開,一個(gè)行至太陽邊,一個(gè)行到太陽系之外,但由于彼此組成的復(fù)合系統(tǒng)處于量子糾纏,對于其中一個(gè)粒子測量得到結(jié)果(例如,自旋為上旋),則另外一個(gè)粒子在之后任意時(shí)間做測量,必定會(huì)得到相關(guān)結(jié)果(在此案例里,自旋為下旋)。給定一系列被量子糾纏的粒子對,對于每一個(gè)粒子對的兩個(gè)粒子做測量,分析所得到的數(shù)據(jù),可以推論,兩個(gè)粒子的性質(zhì)存在著一種相關(guān)現(xiàn)象,盡管它們可能相隔很遙遠(yuǎn),但仍可觀察到這種相關(guān)現(xiàn)象。多次重復(fù)做實(shí)驗(yàn)已證實(shí)這一論點(diǎn),甚至當(dāng)兩個(gè)測量的時(shí)間間隔,比光波傳播于兩個(gè)測量位置所需的時(shí)間間隔還短暫,這現(xiàn)象依然發(fā)生。也就是說,量子糾纏的作用如果將它們之間的關(guān)系看作定域因果關(guān)系,則其速度至少比光速還快。最近完成的一項(xiàng)實(shí)驗(yàn)顯示,量子糾纏的作用速度至少比光速快10,000倍。這是完全違反相對論的“鬼魅般的相互作用”(愛因斯坦語)。EPR相關(guān)說明相關(guān)性壓倒了因果性嗎?沒有!因?yàn)檫@里只是說明定域性的信息傳遞不成立,并不說明一切因果關(guān)系不成立。怎樣解釋這種情況呢?主持這次實(shí)驗(yàn)檢驗(yàn)的物理學(xué)家玻姆這樣解析道:定域的因果關(guān)系沒有成立并不等于非定域的因果性沒有成立,只要認(rèn)定微觀體系總是它的薛定諤波函數(shù)ψ伴隨,那么就可以說這個(gè)物理體系是因果地被確定的。因此,玻姆把這種解釋叫作“因果解釋”(20)。

  連EPR這樣被譽(yù)為20世紀(jì)的“第三次風(fēng)暴”或“狂飆”都必需在相關(guān)的背后去尋找能解釋問題的因果作用,可見因果與相關(guān)的關(guān)系中仍然是因果起著根本性的解釋作用。因此,在大數(shù)據(jù)的研究中,作為物質(zhì)、能量、信息傳遞的因果作用相對一般相關(guān)關(guān)系而言,有決定性的作用是毫不奇怪的。

  從邏輯上看,自從科學(xué)出現(xiàn)以來,因果與相關(guān)的關(guān)系是既相互區(qū)別,又相互交叉。傳統(tǒng)科學(xué)方法一般是從因果與相關(guān)的纏結(jié)中區(qū)分因果與非因果相關(guān),即從一般相關(guān)中找出統(tǒng)計(jì)相關(guān),再從統(tǒng)計(jì)相關(guān)中找出直接因果,大數(shù)據(jù)的實(shí)踐依然符合這個(gè)進(jìn)路;但大數(shù)據(jù)經(jīng)驗(yàn)主義不區(qū)分因果與相關(guān),主張只要一般相關(guān),不要因果。它們之間的關(guān)系可用圖1來表示:

  

  圖1 科學(xué)方法論和大數(shù)據(jù)經(jīng)驗(yàn)主義在因果與相關(guān)關(guān)系上的分歧

  筆者認(rèn)為,大數(shù)據(jù)經(jīng)驗(yàn)主義消除因果關(guān)系的看法是片面的。大數(shù)據(jù)表面上看沒有因果律,或不問因果關(guān)系,但事實(shí)上并不是這樣。再以上面“尿布和啤酒的銷售量有一種正比例的相關(guān)性”作為分析這個(gè)問題的案例。大數(shù)據(jù)方法論最后強(qiáng)調(diào)數(shù)據(jù)的挖掘,如果數(shù)據(jù)挖掘出來的信息對預(yù)測產(chǎn)生作用,它必定帶有一定的普遍性。比如商品銷售中尿布與啤酒之間具有正相關(guān)性,這種正相關(guān)性在大數(shù)據(jù)經(jīng)驗(yàn)主義者們看來只是一種相關(guān)關(guān)系。但從更廣泛的角度來看,這種正相關(guān)性實(shí)際上包含著一種普遍的因果關(guān)系。這是因?yàn)?,通過數(shù)據(jù)分析,發(fā)現(xiàn)一些年輕的(占30%~40%)新爸爸到超市買嬰兒尿布,他們常會(huì)順便買啤酒慰勞自己。有了這種因果關(guān)系才會(huì)有這種消費(fèi)的相關(guān)??磥?,表面的正相關(guān)實(shí)際上可以找到背后的因果關(guān)系。因果與相關(guān)是有區(qū)別的。當(dāng)然,人們并不是一定要弄清因果關(guān)系然后才能行動(dòng),但弄清因果關(guān)系畢竟有利于我們理解各種相關(guān)的機(jī)制。所以,決不能說“知道是什么就夠了,沒必要知道為什么”(21),事實(shí)上,知道“為什么”之后,我們才會(huì)知道未來將必然會(huì)“是什么”。

  三 世界和數(shù)據(jù)的本質(zhì)是混亂的嗎?

  舍恩伯格一方面說,“世界本質(zhì)上是混亂的”(22),而且混亂也構(gòu)成了人腦的本質(zhì);另一方面,他又說“世界本質(zhì)上是數(shù)據(jù)”(23),將這兩個(gè)命題結(jié)合在一起,就表明了人生活在混亂的大數(shù)據(jù)世界之中。

  顯然,與新經(jīng)驗(yàn)主義者南茜·卡特萊特的《斑雜的世界》觀點(diǎn)相似,大數(shù)據(jù)經(jīng)驗(yàn)主義者不再追求精確度;他們強(qiáng)調(diào)探索事物間的相關(guān)關(guān)系,不再追求因果關(guān)系;他們承認(rèn)混雜性,認(rèn)為世界的本質(zhì)是混亂的,這種混亂性只有使用全體數(shù)據(jù)(大數(shù)據(jù))而不是樣本數(shù)據(jù)才能進(jìn)行說明。

  統(tǒng)計(jì)學(xué)家們業(yè)已證明,采樣分析的精確性隨著采樣隨機(jī)性的增加而大幅度提高,但與樣本數(shù)量的增加關(guān)系不大。所以問題的關(guān)鍵在于:增加數(shù)據(jù)的數(shù)量,只是想要得到更多的異常值,大數(shù)據(jù)采用全體數(shù)據(jù)的處理方法,原因在于不會(huì)錯(cuò)過這些異常值,使最后的分析和預(yù)測結(jié)果更精確。誠然,這種大數(shù)據(jù)處理方法的初衷是好的,但具體實(shí)現(xiàn)起來卻面臨著困難:研究對象越來越復(fù)雜,如何保證能獲得所有的、包含了全部信息的數(shù)據(jù)呢?退一步講,即使以后在技術(shù)上能夠得以實(shí)現(xiàn),但使用這種方法的同時(shí)就說明這個(gè)世界并不是完全混亂的,而是有規(guī)律可循的?!按髷?shù)據(jù)的核心在于預(yù)測”,運(yùn)用各種算法從海量數(shù)據(jù)中預(yù)測未來可能發(fā)生的事情,這種做法,同樣說明大數(shù)據(jù)表面看來是混亂的、隨機(jī)產(chǎn)生的,但就在這種混雜的狀態(tài)中卻包含了規(guī)律性。運(yùn)用計(jì)算機(jī)模擬方法對混沌理論中的邏輯斯蒂方程進(jìn)行迭代模擬,所顯示的圖像清晰地證明了這種觀點(diǎn)。自然界的演化規(guī)律如此(確定性與隨機(jī)性的統(tǒng)一),大數(shù)據(jù)時(shí)代的表象亦應(yīng)該是如此,但卻不能因?yàn)榇嬖陔S機(jī)性,就一竿子將規(guī)律性全部打倒,說世界的本質(zhì)就是混亂的,這是一種悲觀的看法。《爆發(fā):大數(shù)據(jù)時(shí)代預(yù)見未來的新思維》重振了人類在新時(shí)代掌握自身命運(yùn)的新希望。在作者巴拉巴西看來,大數(shù)據(jù)的海量記錄雖然引爆了個(gè)人隱私危機(jī),但同時(shí)也創(chuàng)造了歷史的機(jī)遇,那就是我們擁有了成千上萬人的詳細(xì)行為記錄。這些大數(shù)據(jù)實(shí)驗(yàn)研究的結(jié)果證明,人類的大部分行為都遵循于一定的規(guī)律、模型以及原理法則,而且在可重現(xiàn)性和可預(yù)測性方面與自然科學(xué)不相上下?;谶@種積極的信念,在“爆發(fā)洞察”欄目,巴拉巴西說明了他寫此書的根本目標(biāo):“我會(huì)向大家展示,在日趨精密的數(shù)字技術(shù)創(chuàng)造的這個(gè)巨大、復(fù)雜而又翔實(shí),并且超越以往任何科技水平的研究實(shí)驗(yàn)室面前,人類赤裸裸的一面。通過對這些發(fā)現(xiàn)進(jìn)行追蹤研究,大家會(huì)看到生命的韻律,會(huì)發(fā)現(xiàn)人類行為中更深層次的規(guī)律,并確證這些行為是能夠被探究、被預(yù)測,而且無疑是能夠?yàn)槿怂玫?。有了這些四處搜集來的信息,我們不會(huì)再把人類的行為視為互不相關(guān)、隨意偶然的獨(dú)立事件。相反,它們應(yīng)該是相互依存的奇妙大網(wǎng)的一部分,是相互串聯(lián)的故事集中的一個(gè)片段。它們會(huì)在不經(jīng)意時(shí)顯示次序,在意想不到之處偶然出現(xiàn)。我們觀察得越仔細(xì)就越容易發(fā)現(xiàn),人類行為遵循著一套簡單并可重復(fù)的模型,而這些模型則受制于更加廣泛的規(guī)律?!?24)


 ?、賀ichard Fumerton,Anthony M.Quinton,Baron Quinton,'Empiricism',Encyclopedia Britannica.http://global./EBchecked/topic/186146/empiricism.

 ?、冖酆橹t主編:《邏輯經(jīng)驗(yàn)主義》上卷,商務(wù)印書館,1982,第16、18頁;第39頁。

  ④所謂律則機(jī)器就是對元素或因素有足夠的安排,使它有能力在特定環(huán)境下有重復(fù)運(yùn)作,從而顯示出規(guī)則性行為,因而被我們表達(dá)為科學(xué)定律。

 ?、軳.Cartwright,The Dappled World,Cambridge University Press,1999,p.1.

  ⑥(11)(12)涂子沛:《大數(shù)據(jù):正在到來的數(shù)據(jù)革命,以及它如何改變政府、商業(yè)與我們的生活》,廣西師范大學(xué)出版社,2013,封面;第89頁;第90頁。

  ⑦⑧⑨(14)(15)(17)(21)(22)(23)維克托·邁爾(Mayer)-舍恩伯格、肯尼思·庫克耶:《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》,盛楊燕、周濤譯,浙江人民出版社,2013,第92頁;第92頁;第93頁;第83頁;第67頁;第71頁;第71頁;第246頁;第Ⅴ頁。

 ?、?014年1月10在黑龍江大學(xué)召開的“大數(shù)據(jù)時(shí)代的哲學(xué)問題學(xué)術(shù)研討會(huì)”上孫博文教授作了“大數(shù)據(jù)與科學(xué)規(guī)律”的會(huì)議報(bào)告,此段引文是本文作者根據(jù)他的發(fā)言做的會(huì)議記錄。

  (13)George Cowan et al.,eds.,Complexity:Metaphors,Models and Reality,David Pines,David Meltzer,Addison-Wesley Publishing Company,1994,p.18.

  (16)例如尿布的銷售量和啤酒的銷售量就有正比的相關(guān)性。

  (18)B.Russell,'On the Notion of Cause',Proceedings of the Aristotelian Society,13,1912,Reprinting in Readings in Philosophy of Science,Appleton-Century-Corfts,INC.,pp.387~396.

  (19)D.M.Armstrong,A World of States of Affairs,Cambridge University Press,1997,p.238.

  (20)轉(zhuǎn)引自董光璧、田昆玉:《EPR關(guān)聯(lián)之謎》,陜西科技出版社,1988,第120頁。

  (24)艾伯特-拉斯洛·巴拉巴西:《爆發(fā):大數(shù)據(jù)時(shí)代預(yù)見未來的新思維》,馬慧譯,中國人民大學(xué)出版社,2012,第13頁。


    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請遵守用戶 評(píng)論公約

    類似文章 更多