日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

頭條 | 梁玉成:大數(shù)據(jù)不能替代理性思考

 湯灌 2015-04-25

有關(guān)大數(shù)據(jù)的討論,幾年間已經(jīng)從早期的概念發(fā)展到今天的應(yīng)用,應(yīng)用領(lǐng)域也已從早期的商業(yè)領(lǐng)域拓展到學(xué)術(shù)領(lǐng)域、政策領(lǐng)域。首先,大數(shù)據(jù)特殊之處在于其數(shù)據(jù)來(lái)自于全體,而不再是部分?jǐn)?shù)據(jù)的采樣。采樣數(shù)據(jù)無(wú)論如何抽取都會(huì)有抽樣偏差,進(jìn)而可能導(dǎo)致結(jié)果的偏差,在這個(gè)意義上,大數(shù)據(jù)時(shí)代,可以依靠強(qiáng)大的數(shù)據(jù)處理能力處理全部的數(shù)據(jù),這是多么令人興奮。其次,數(shù)據(jù)作為知識(shí)的重要來(lái)源,抽樣調(diào)查數(shù)據(jù)也好,二手文獻(xiàn)數(shù)據(jù)也好,人們均是從中進(jìn)行分析并獲取知識(shí),但這類數(shù)據(jù)中包含的變量總歸有限,知識(shí)的獲取也因而受限,而大數(shù)據(jù)將大量結(jié)構(gòu)復(fù)雜、類型眾多的異構(gòu)數(shù)據(jù)結(jié)合在一起,構(gòu)成有無(wú)限組合可能的數(shù)據(jù)集合,使用計(jì)算能力可以無(wú)限擴(kuò)充的云計(jì)算來(lái)進(jìn)行,作為知識(shí)生產(chǎn)來(lái)源的大數(shù)據(jù)的數(shù)量級(jí)別進(jìn)而達(dá)到PB級(jí),因此其中潛藏的知識(shí)不知幾何,人們獲取知識(shí)的能力也可能會(huì)大大增加。

  大數(shù)據(jù)的先行者通過(guò)各種數(shù)學(xué)和物理算法在大數(shù)據(jù)中掘金,一些人類過(guò)去未能發(fā)現(xiàn)的潛在關(guān)聯(lián)被發(fā)現(xiàn)和應(yīng)用,并取得了矚目的成就和進(jìn)展。基于此,大數(shù)據(jù)理論基本都提出:基于大數(shù)據(jù)發(fā)掘出的“有效”相關(guān)性關(guān)系即可進(jìn)行預(yù)測(cè);有效性不需要知道“為什么”,知道“是什么”即可。數(shù)據(jù)和算法驅(qū)動(dòng)研究成為大數(shù)據(jù)研究的主要范式。我相信,大數(shù)據(jù)的無(wú)預(yù)設(shè)前提的數(shù)據(jù)驅(qū)動(dòng)的相關(guān)關(guān)系的挖掘,有著解放人類被理論局限性束縛的手腳的功用。但是,我們會(huì)不會(huì)走出一個(gè)陷阱,又踏入另外一個(gè)陷阱呢?

  我首先想討論的第一個(gè)問(wèn)題是,來(lái)自于全體數(shù)據(jù)的結(jié)論就是可靠的嗎?在我參加的一次博士論文答辯中,答辯人報(bào)告,她使用全國(guó)人口普查數(shù)據(jù)發(fā)現(xiàn),老年人的健康與財(cái)富之間的關(guān)系是:老年人健康水平越低則財(cái)富越多,或者反過(guò)來(lái)說(shuō),老年人財(cái)富越多越不健康。評(píng)委當(dāng)時(shí)一片嘩然。事實(shí)上這是合情理的,其機(jī)理就是,一個(gè)越不健康的老人,就需要越多越好的醫(yī)療資源才能存活,而越多的財(cái)富能保證其越多越好的醫(yī)療資源。因此,相同的不健康狀況的老人中,錢越多則具有越高的生存概率。換個(gè)角度看,不健康的老人中,沒(méi)錢的死了,有錢的活下來(lái)了;越是不健康的老人中,只有越有錢的才能存活。因此,全體數(shù)據(jù)的結(jié)果是:老人的財(cái)富與健康呈現(xiàn)出負(fù)相關(guān)。這是來(lái)自于全體數(shù)據(jù)的結(jié)果,顯然是合理的,但其顯示的相關(guān)關(guān)系卻有些荒謬。

  這樣就導(dǎo)致了我的第二個(gè)問(wèn)題:追求這樣的相關(guān)關(guān)系有價(jià)值嗎?這樣的相關(guān)關(guān)系可信嗎?我想讀者都不會(huì)相信,健康與財(cái)富呈現(xiàn)出的負(fù)相關(guān)是正確的相關(guān)關(guān)系,而出于理性,相信的恰恰是健康與財(cái)富應(yīng)該呈現(xiàn)出正相關(guān)的關(guān)系。在這里,社會(huì)實(shí)體所表現(xiàn)出來(lái)的模式顯然違背了我們對(duì)社會(huì)的理論認(rèn)識(shí)。我們都知道,理論是現(xiàn)實(shí)在頭腦中的反映,但是這個(gè)例子告訴我們,人類通過(guò)理性建構(gòu)的理論并非社會(huì)現(xiàn)實(shí)在頭腦中的簡(jiǎn)單反映。這里,我提出一對(duì)概念來(lái)闡述我的觀點(diǎn)。變量之間的關(guān)系有兩種表現(xiàn)形式,一種是社會(huì)實(shí)體的表現(xiàn)形式(real pattern),一種是社會(huì)理論的表現(xiàn)形式(relation pattern)。前者是社會(huì)實(shí)體直接體現(xiàn)出來(lái)的變量和變量之間的相關(guān)關(guān)系,后者是學(xué)者通過(guò)理性思考建構(gòu)的理論空間的因果關(guān)系。變量在社會(huì)實(shí)體上表現(xiàn)的相關(guān)關(guān)系,由于社會(huì)實(shí)體的選擇性偏誤(例子中是由死亡的非隨機(jī)性造成),導(dǎo)致了相關(guān)關(guān)系的扭曲,甚至相反。因此,人們寧愿相信自己的理性,而不愿只是機(jī)械地接受社會(huì)實(shí)體表現(xiàn)出來(lái)的模式。

  人類的理性,使得我們知曉變量間在社會(huì)實(shí)體上的表現(xiàn)形式并不必然等于社會(huì)理論上的表現(xiàn)形式。對(duì)大數(shù)據(jù)使用數(shù)據(jù)驅(qū)動(dòng),能獲得的僅僅是社會(huì)實(shí)體上的表現(xiàn)形式,這可能與理論空間的因果關(guān)系一致,也可能完全相反。因此,放棄人的理性思考,放棄獲得具有嚴(yán)密因果邏輯的理論上的表現(xiàn)形式,使用找到相關(guān)關(guān)系即可的大數(shù)據(jù)分析范式——數(shù)據(jù)驅(qū)動(dòng),在我看來(lái)是無(wú)法接受的。大數(shù)據(jù)的分析,仍然需要理論驅(qū)動(dòng)和理論理解所建構(gòu)的因果關(guān)系。因此,無(wú)論如何精巧的大數(shù)據(jù)分析工具的使用,都不能代替生產(chǎn)工具的人的理性思考?!拔淦鞯呐小辈⒉荒苋〈芭械奈淦鳌薄4髷?shù)據(jù)時(shí)代依然如此。


原文來(lái)自:《社會(huì)科學(xué)報(bào)》2015年2月12日

作者單位:中山大學(xué)社會(huì)學(xué)與社會(huì)工作系

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多