1 引言 知識(shí)圖譜是一個(gè)包含很多技術(shù)內(nèi)容的知識(shí)體系,總的來(lái)說(shuō),是處理關(guān)聯(lián)的知識(shí),核心是數(shù)據(jù),但強(qiáng)調(diào)了數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系。簡(jiǎn)單來(lái)看,可以認(rèn)為是數(shù)據(jù)庫(kù)或知識(shí)庫(kù),和語(yǔ)義網(wǎng)有著千絲萬(wàn)縷的聯(lián)系。知識(shí)圖譜是由谷歌首先提出來(lái)的,用于優(yōu)化它的搜索能力,之后,獲得了蓬勃的發(fā)展,研究的人也越來(lái)越多。 知識(shí)圖譜的出現(xiàn),不是一蹴而就的,有一個(gè)緩慢演進(jìn)的過(guò)程,包括現(xiàn)在,也還在發(fā)展中。知識(shí)圖譜的發(fā)展,可以從多個(gè)方面進(jìn)行闡述,比如開(kāi)放鏈接數(shù)據(jù)的思想,知識(shí)表示,知識(shí)推理,知識(shí)存儲(chǔ)等,伴隨著信息技術(shù)特別是人工智能技術(shù)的發(fā)展,知識(shí)圖譜不斷融合新的技術(shù),不斷發(fā)展和完善。此處主要講述知識(shí)圖譜理論的形成過(guò)程。 2 信息機(jī)器Memex 1945年,一個(gè)美國(guó)科學(xué)家Vannevar Bush在《大西洋月刊》上發(fā)表了一篇文章《As We May Think》,提出一種信息機(jī)器的構(gòu)想,就像下圖中的樣子。 在Bush博士的設(shè)想中,這種機(jī)器還可以與圖書(shū)館聯(lián)網(wǎng)。通過(guò)某種機(jī)制,將圖書(shū)館收藏的膠卷,自動(dòng)裝載到本地機(jī)器上。因此,只通過(guò)這一個(gè)機(jī)器,就可以實(shí)現(xiàn)海量的信息檢索。他將這種機(jī)器命名為Memex,也就是“memory extender”這兩個(gè)單詞詞首的組合,意思是“記憶的延伸”。 文中描述了對(duì)這種機(jī)器的設(shè)想,“Wholly new forms of encyclopedias will appear, ready-made with a mesh of associative trails running through them, ready to be dropped into the memex and there amplified.” 這個(gè)設(shè)想的影響非常大,后來(lái)許多早期的計(jì)算機(jī)論文中都提到了這個(gè)機(jī)器。然后,文中關(guān)于信息切換的描述,直接啟發(fā)了“超文本協(xié)議”(hypertext)的發(fā)明?,F(xiàn)在,我們?cè)诨ヂ?lián)網(wǎng)上不同的鏈接之間跳轉(zhuǎn),其源頭都可以追溯到這篇文章。 3 以超鏈接為主的WEB 1989年3 月,蒂姆·伯納·李爵士(Tim Berners-Lee)向CERN遞交了一份立項(xiàng)建議書(shū),建議采用超文本技術(shù)(Hypertext)把CERN內(nèi)部的各個(gè)實(shí)驗(yàn)室連接起來(lái),在系統(tǒng)建成后,將可能擴(kuò)展到全世界。 在建議書(shū)中,有一段話以超文本為核心的web,比利用層級(jí)結(jié)構(gòu)的方式,更容易讓熱接受和傳播。 This is why a 'web' of notes with links (like references) between them is far more useful than a fixed hierarchical system. When describing a complex system, many people resort to diagrams with circles and arrows. Circles and arrows leave one free to describe the interrelationships between things in a way that tables, for example, do not. The system we need is like a diagram of circles and arrows, where circles and arrows can stand for anything. 文中說(shuō)明了超文本利用圓圈和箭頭可以自由的描述任何事物,比使用層級(jí)結(jié)構(gòu)的表格要靈活的多,特別是描述復(fù)雜系統(tǒng),作用更加突出,這就是超文本的作用。這個(gè)思想也是現(xiàn)在比較流行的思維導(dǎo)圖的核心思想,利用發(fā)散思維,建立聯(lián)系。 4 以鏈接數(shù)據(jù)為核心的語(yǔ)義網(wǎng) 語(yǔ)義網(wǎng)的概念也是由萬(wàn)維網(wǎng)聯(lián)盟的蒂姆在1998年提出,它的核心是通過(guò)給萬(wàn)維網(wǎng)上的文檔 (如:HTML文檔、XML文檔)添加能夠被計(jì)算機(jī)所理解的語(yǔ)義“元數(shù)據(jù)”(外語(yǔ):Meta data),從而使整個(gè)互聯(lián)網(wǎng)成為一個(gè)通用的信息交換媒介。 語(yǔ)義網(wǎng)不同于現(xiàn)在WWW,現(xiàn)有的WWW是面向文檔而語(yǔ)義網(wǎng)則面向文檔所表示的數(shù)據(jù),而語(yǔ)義網(wǎng)更重視于計(jì)算機(jī)“理解與處理”,并且具有一定的判斷、推理能力。 2006年蒂姆·伯納斯-李在普林斯頓大學(xué)演講和后期接受媒體采訪時(shí)公開(kāi)表示,他最初將這種智能網(wǎng)絡(luò)命名為語(yǔ)義網(wǎng)或許不夠貼切,也許更準(zhǔn)確的名稱(chēng)應(yīng)該是數(shù)據(jù)網(wǎng)(外語(yǔ):Data Web)。 5 谷歌知識(shí)圖譜,things, not strings 鏈接數(shù)據(jù)不斷積累,數(shù)據(jù)量以幾何量級(jí)增長(zhǎng),如何更好的使用這些數(shù)據(jù),搜索引擎公司Google提出了知識(shí)圖譜的概念。辛格博士曾經(jīng)說(shuō)過(guò),The world is not made of strings , but is made of things. 知識(shí)圖譜的提出,目的在于更好的利用開(kāi)放鏈接數(shù)據(jù),將搜索字符串變?yōu)樗阉髡鎸?shí)世界中的事物,將一個(gè)事物通過(guò)內(nèi)部特征(屬性)和外部聯(lián)系(關(guān)系),立體的呈現(xiàn)在人們面前,將知識(shí)圖譜看作一張以關(guān)聯(lián)關(guān)系為主的巨大圖譜,圖譜中,點(diǎn)代表客觀事物,邊代表了事物的屬性或關(guān)系。 6 結(jié)語(yǔ) 在知識(shí)圖譜的演進(jìn)過(guò)程中,還有很多思想和技術(shù)起到了非常大的作用,比如本體論,本來(lái)是哲學(xué)中的概念,被引入到知識(shí)圖譜中,用來(lái)指導(dǎo)知識(shí)表示,使得知識(shí)圖譜的知識(shí)表示更加規(guī)范,能夠?yàn)橛?jì)算機(jī)所理解,在知識(shí)圖譜發(fā)展中起到了不可或缺的作用。 原文:https://www.cnblogs.com/coodream2009/p/11145096.html |
|
來(lái)自: timtxu > 《教育與培訓(xùn)》