一、 幾個(gè)基本概念 信息:生物及具有自動(dòng)控制系統(tǒng)的機(jī)器,通過(guò)感覺器官和相應(yīng)的設(shè)備與外界進(jìn)行交換的一切內(nèi)容。 知識(shí):人類對(duì)各種大量信息進(jìn)行思維分析,加工提煉,并加以系統(tǒng)和深化而形成的結(jié)果。 情報(bào):決策所需的知識(shí)和智慧。 文獻(xiàn):指記錄有知識(shí)的一切載體。 以上基本概念之間的關(guān)系:知識(shí)來(lái)源于信息,是理性化、優(yōu)化和系統(tǒng)化了的信息;情報(bào)是解決特定問(wèn)題的知識(shí)和智慧,是激活的那部分知識(shí);文獻(xiàn)是它們的載體。 信息檢索:廣義地說(shuō):指信息存儲(chǔ)與檢索;狹義地說(shuō):僅指該過(guò)程的后半部分,即從信息集合中找出所需信息的過(guò)程,相當(dāng)于人們所說(shuō)的信息查詢(information search)。信息檢索的本質(zhì)是信息用戶的需求和信息集合的比較與選擇,即匹配的過(guò)程。 二、 信息檢索的方法、途徑和步驟 1、 信息檢索的方法 瀏覽法:直接瀏覽各類信息源。 追溯法:從文獻(xiàn)末尾所著的參考文獻(xiàn)入手,逐一追查,但文獻(xiàn)查不全。 常用法:(1)順查法:按時(shí)間順序由遠(yuǎn)而近的檢索方法。 (2)倒查法:由近而遠(yuǎn)的逆時(shí)間順序的檢索方法。多用于一些新的課題。 (3)抽查法:根據(jù)檢索需求查找某一時(shí)間內(nèi)文獻(xiàn)信息的方法。 (4)綜合法:又稱循環(huán)法。將以上方法綜合應(yīng)用的檢索方法。例如:在檢索某課題時(shí),首先用瀏覽法在核心期刊查到兩三篇論文,再根據(jù)文章后面所附的參考文獻(xiàn)用追溯法檢索出一批文獻(xiàn),而后發(fā)現(xiàn)某位著者的文章被多次引用,再用常用法檢索出該著者關(guān)于該課題的數(shù)篇有價(jià)值的文章。 2、 信息檢索的途徑 (1)從外部特征查找文獻(xiàn) 題名途徑(書、刊、篇名)、著者途徑(作者姓名)、序號(hào)途徑(書號(hào)ISBN、期刊號(hào)ISSN、專利號(hào)、報(bào)告號(hào)、標(biāo)準(zhǔn)號(hào)、登錄號(hào)、文摘號(hào)等)。 (2)從文獻(xiàn)內(nèi)容特征查找文獻(xiàn) 分類途徑、主題途徑、關(guān)鍵詞途徑、分類主題途徑、其他途徑。 3、 信息檢索的步驟 (1)分析檢索課題,明確檢索要求。確定檢索的學(xué)科范圍、時(shí)間范圍、地域 范圍、文獻(xiàn)類型等。 (2)選擇檢索工具或數(shù)據(jù)庫(kù)。 (3)制定檢索策略——確定檢索方法、途徑、用詞及邏輯關(guān)系、位置關(guān)系。 (4)進(jìn)行查找,加上輔助性查找(最新期刊、年鑒及百科全書、教科書等),獲取所需文獻(xiàn)。 三、 檢索工具 1、書目:主要報(bào)道文獻(xiàn)的外部特征,著錄具體出版事項(xiàng)及其收藏信息。例如:全國(guó)新書目等。 2、索引:將文獻(xiàn)的外部特征或內(nèi)部特征用各種檢索語(yǔ)言進(jìn)行描述,并將它們按一定的方法組織起來(lái),注明出處。索引與目錄的不同在于它不僅能揭示信息的外部特征,而且能揭示信息的內(nèi)部特征。常見的索引有:主題索引、分類索引、關(guān)鍵詞索引。例如:全國(guó)報(bào)刊索引等。 3、文摘:文摘描述文獻(xiàn)外部特征的基礎(chǔ)上,還增加有揭示內(nèi)容特征的摘要部分,文摘一般由題錄和內(nèi)容摘要兩部分組成。它是系統(tǒng)地報(bào)道、積累和檢索文獻(xiàn)信息的主要工具,是傳統(tǒng)檢索工具的核心。例如:中國(guó)紡織文摘等。 4、各類參考工具書:分析和著錄大量具體而常用的科學(xué)數(shù)據(jù)與事實(shí)以備查用的各種常用工具書的總稱。包括:百科全書、年鑒、詞典、指南、手冊(cè)、名錄等。 5、搜索引擎:將網(wǎng)絡(luò)信息資源分門別類地組織起來(lái),通過(guò)搜索網(wǎng)址的方法來(lái)實(shí)現(xiàn)信息檢索。它是一種網(wǎng)絡(luò)信息的檢索工具。網(wǎng)絡(luò)搜索引擎很多,例如:比較著名的英文搜索引擎有:Yahoo(www.yahoo.com),Altavista(www.altavista.com),Lycos(www.lycos.com),NorthernLight(www.northernlight.com)。比較著名的中文搜索引擎有:搜弧(www.sohu.com或www.sohu.com.cn),新浪(www.sina.com.cn),Yahoo中國(guó)(www.yahoo.com),網(wǎng)易(www.yeah.net或www.163.com)等等。 6、各類數(shù)據(jù)庫(kù)。如需要查找在期刊上發(fā)表的論文可使用清華同方光盤股份有限公司的《中國(guó)學(xué)術(shù)期刊數(shù)據(jù)庫(kù)》,重慶維普資訊公司的《科技期刊數(shù)據(jù)庫(kù)》;查詢圖書可使用《超星電子圖書館數(shù)據(jù)庫(kù)》,這些數(shù)據(jù)庫(kù)通過(guò)我院圖文信息中心主頁(yè)均可進(jìn)入。 四、 檢索效率 1、檢索效率是指利用檢索系統(tǒng)(或工具)開展檢索服務(wù)時(shí)產(chǎn)生的有效結(jié)果。檢索效率包括技術(shù)效果和社會(huì)經(jīng)濟(jì)效果兩方面。技術(shù)效果是由檢索系統(tǒng)完成其功能的能力確定,主要指系統(tǒng)的性能和服務(wù)質(zhì)量。經(jīng)濟(jì)效果由完成這些功能的價(jià)值確定,主要指檢索系統(tǒng)服務(wù)的成本和時(shí)間。有人提出了六項(xiàng)評(píng)價(jià)系統(tǒng)性能的指標(biāo),它們是:收錄范圍、查全率、查準(zhǔn)率、響應(yīng)時(shí)間、用戶負(fù)擔(dān)和輸出形式。其中,查全率和查準(zhǔn)率是兩個(gè)最主要也是最常用的指標(biāo)。 2、查全率和查準(zhǔn)率 如果檢索出的相關(guān)文獻(xiàn)量是a,不相關(guān)文獻(xiàn)量是b,未檢索出的相關(guān)文獻(xiàn)量是c,那么: 查全率 = 檢索出的相關(guān)文獻(xiàn)量/數(shù)據(jù)庫(kù)中收錄的全部相關(guān)文獻(xiàn)量=a/(a+c)*100% 查準(zhǔn)率 = 檢索出的相關(guān)文獻(xiàn)量/檢索出的全部文獻(xiàn)量 =a/(a+b)*100% 結(jié)果表明:查全率和查準(zhǔn)率之間存在互逆關(guān)系,如對(duì)一檢索系統(tǒng)要求較高的查全率,則查準(zhǔn)率將下降,反之亦然。目前,國(guó)外一些信息檢索系統(tǒng)能達(dá)到的查全率在60%~70%,查準(zhǔn)率在40%~50%之間。 5、 調(diào)整查全率和查準(zhǔn)率的措施 提高查全率一般要擴(kuò)展檢索詞和檢索方法,而提高查準(zhǔn)率則要限制檢索條件。具體可參考以下措施: (1)提高查全率措施: ·選擇上位詞和相關(guān)詞。 ·調(diào)節(jié)檢索式的網(wǎng)羅度,刪除不必要的組合。 ·分類檢索或用邏輯或連接相關(guān)檢索詞。 ·截詞檢索。 ·增加檢索途徑。 (2)提高查準(zhǔn)率措施: ·提高專指度(用下位詞或換專指性強(qiáng)的自由詞)。 ·用邏輯與連接相關(guān)檢索詞。 ·用文獻(xiàn)外部特征限制輸出結(jié)果。 ·用“二次檢索”、“條件檢索”排除誤檢。 ·限制檢索字段,指定鄰接和優(yōu)先關(guān)系。
|
|
來(lái)自: 昵稱GkWh9DYk > 《搜索方法》