日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

文獻(xiàn)信息檢索10

 梨落野花 2006-04-25
檢索語言從規(guī)范、授控的情況,有 人工語言 (規(guī)范語言)(artificial language) 自然語言(非規(guī)范語言)(natural language),

   檢索詞是檢索語言的基本成分,檢索詞的有序集合構(gòu)成詞表(thesaurus)。

   自然語言

   自然語言是取其自然形態(tài),不受控,使用非規(guī)范詞(uncontrolled term)或稱自由詞(free term)。自然語言極其豐富、復(fù)雜和多樣,存在著一詞多義、多詞一義及詞義交叉的現(xiàn)象。常見的有同義詞、近義詞、同型異義詞等。

   自由詞有較大的靈活性,使用隨意,專指性強(qiáng),查準(zhǔn)率高。它能及時(shí)地反映最新出現(xiàn)的詞匯,反映規(guī)范詞難于表達(dá)的特定概念或新概念。在全文檢索中自然語言獨(dú)領(lǐng)風(fēng)騷。大容量、高速、高性能的計(jì)算機(jī)檢索系統(tǒng)的自動(dòng)標(biāo)引,使得自由詞的全文檢索,即自由文本檢索(free-text search)占的比例越來越高。自然語言的缺點(diǎn)是由于它不規(guī)范,缺乏對(duì)詞匯的控制能力,也無法指示概念之間的關(guān)系,影響到檢索效率。
 
  人工語言

   人工語言(規(guī)范語言)(artificial language,controlled language)受信息檢索的控制,使用控制、規(guī)范詞(controlled term)。人工語言的規(guī)范處理重在兩個(gè)方面:一是使一個(gè)概念只用一個(gè)詞匯來表達(dá),這樣就避免了多詞一義的情況;二是使一個(gè)標(biāo)引詞只能表達(dá)一個(gè)概念,這樣就排除了一詞多義現(xiàn)象,這時(shí),需要加上必要的限定和注釋。比如"飛機(jī)"這一概念,用英語檢索時(shí),可用plane , airplane , aero plane , aircraft 等同義詞,規(guī)范就是選定其中最適合的一個(gè)詞匯來標(biāo)引這一概念,如果選定aircraft 一詞,則其余詞均為非規(guī)范詞。在使用aircraft規(guī)范詞來檢索時(shí),其結(jié)果將包含所有有關(guān)飛機(jī)這一概念的文獻(xiàn),而不管這些文獻(xiàn)中是否確切出現(xiàn)過aircraft這個(gè)詞。

   規(guī)范詞語言采用特定詞匯來網(wǎng)羅、指示寬度適當(dāng)?shù)母拍睿z索選擇。用戶在檢索時(shí)可省略對(duì)其概念的全部同義詞或近義詞的考慮,也避免了這些詞在輸入時(shí)的麻煩和出錯(cuò),它提供了一種比較高效、能有效避免漏檢、誤檢的查找。在檢索中普遍使用規(guī)范語言及其詞表,凡有規(guī)范詞表的檢索工具,在主題檢索時(shí)首選的是規(guī)范詞檢索。

   在實(shí)際檢索中,檢索詞的選擇是個(gè)復(fù)雜的問題,必須考慮表達(dá)概念的準(zhǔn)確與完善,通常是規(guī)范語言和非規(guī)范語言交混使用來滿足各種不同的需要。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多