日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

<td id="gup6s"><code id="gup6s"><small id="gup6s"></small></code></td>

<strike id="gup6s"><code id="gup6s"></code></strike>

<fieldset id="gup6s"><table id="gup6s"></table></fieldset>

<menu id="gup6s"><form id="gup6s"></form></menu>

<span id="gup6s"><i id="gup6s"></i></span>

搜索

分享

QQ空間 QQ好友新浪微博微信

[轉(zhuǎn)]總結(jié)一下Meta的用法及robot.txt的講解_【被射中の奶?！郡慰鞓诽焯?『虛擬...

素行 2007-04-25

展開全文

總結(jié)一下Meta的用法及robot.txt的講解

一些不受注意的東西的也不得不去了解一下了..
上網(wǎng)查找了一下robots.txt的用法,卻一個不留神查到了關(guān)于meta的一些用法，覺得挺有用的，把詳細的用法寫出來了關(guān)于Meta的用法

meta是用來在HTML文檔中模擬HTTP協(xié)議的響應(yīng)頭報文。meta 標(biāo)簽用于網(wǎng)頁的<head>與</head>中，meta 標(biāo)簽的用處很多。meta 的屬性有兩種：name和http-equiv。name屬性主要用于描述網(wǎng)頁，對應(yīng)于content（網(wǎng)頁內(nèi)容），以便于搜索引擎機器人查找、分類（目前幾乎所有的搜索引擎都使用網(wǎng)上機器人自動查找meta值來給網(wǎng)頁分類）。這其中最重要的是description（站點在搜索引擎上的描述）和keywords（分類關(guān)鍵詞），所以應(yīng)該給每頁加一個meta值。比較常用的有以下幾個:

name 屬性

　　 1、<meta name="generator" contect="">用以說明生成工具（如Microsoft FrontPage 4.0）等；

　　 2、<meta name="keywords" contect="">向搜索引擎說明你的網(wǎng)頁的關(guān)鍵詞；

　　 3、<meta name="description" contect="">告訴搜索引擎你的站點的主要內(nèi)容；

　　 4、<meta name="author" contect="你的姓名">告訴搜索引擎你的站點的制作的作者；

　　 5、<meta name="robots" contect="all|none|index|noindex|follow|nofollow">

　　其中的屬性說明如下：

　　設(shè)定為all：文件將被檢索，且頁面上的鏈接可以被查詢；

　　設(shè)定為none：文件將不被檢索，且頁面上的鏈接不可以被查詢；

　　設(shè)定為index：文件將被檢索；

　　設(shè)定為follow：頁面上的鏈接可以被查詢；

　　設(shè)定為noindex：文件將不被檢索，但頁面上的鏈接可以被查詢；

　　設(shè)定為nofollow：文件將不被檢索，頁面上的鏈接可以被查詢。

http-equiv屬性

　　 1、<meta http-equiv="Content-Type" contect="text/html";charset=gb_2312-80">

　　和 <meta http-equiv="Content-Language" contect="zh-CN">用以說明主頁制作所使用的文字以及語言；

　　又如英文是ISO-8859-1字符集，還有BIG5、utf-8、shift-Jis、Euc、Koi8-2等字符集；

　　 2、<meta http-equiv="Refresh" contect="n;url=http://yourlink">定時讓網(wǎng)頁在指定的時間n內(nèi)，跳轉(zhuǎn)到頁面http;//yourlink；

　　 3、<meta http-equiv="Expires" contect="Mon,12 May 2001 00:20:00 GMT">可以用于設(shè)定網(wǎng)頁的到期時間，一旦過期則必須到服務(wù)器上重新調(diào)用。需要注意的是必須使用GMT時間格式；

　　 4、<meta http-equiv="Pragma" contect="no-cache">是用于設(shè)定禁止瀏覽器從本地機的緩存中調(diào)閱頁面內(nèi)容，設(shè)定后一旦離開網(wǎng)頁就無法從Cache中再調(diào)出；

　　 5、<meta http-equiv="set-cookie" contect="Mon,12 May 2001 00:20:00 GMT">cookie設(shè)定，如果網(wǎng)頁過期，存盤的cookie將被刪除。需要注意的也是必須使用GMT時間格式；

　　 6、<meta http-equiv="Pics-label" contect="">網(wǎng)頁等級評定，在IE的internet選項中有一項內(nèi)容設(shè)置，可以防止瀏覽一些受限制的網(wǎng)站，而網(wǎng)站的限制級別就是通過meta屬性來設(shè)置的；

　　 7、<meta http-equiv="windows-Target" contect="_top">強制頁面在當(dāng)前窗口中以獨立頁面顯示，可以防止自己的網(wǎng)頁被別人當(dāng)作一個frame頁調(diào)用；

　　 8、<meta http-equiv="Page-Enter" contect="revealTrans(duration=10,transtion=50)">和<meta http-equiv="Page-Exit" contect="revealTrans(duration=20，transtion=6)">設(shè)定進入和離開頁面時的特殊效果，這個功能即FrontPage中的“格式/網(wǎng)頁過渡”，不過所加的頁面不能夠是一個frame頁面。

關(guān)于robots.txt的講解

1.什么是robots.txt文件?
搜索引擎通過一種程序robot（又稱spider），自動訪問互聯(lián)網(wǎng)上的網(wǎng)頁并獲取網(wǎng)頁信息。
您可以在您的網(wǎng)站中創(chuàng)建一個純文本文件robots.txt，在這個文件中聲明該網(wǎng)站中不想被robot訪問的部分，這樣，該網(wǎng)站的部分或全部內(nèi)容就可以不被搜索引擎收錄了，或者指定搜索引擎只收錄指定的內(nèi)容。

2.robots.txt文件放在哪里?
robots.txt文件應(yīng)該放在網(wǎng)站根目錄下。舉例來說，當(dāng)robots訪問一個網(wǎng)站（比如http://www.）時，首先會檢查該網(wǎng)站中是否存在http://www./robots.txt 這個文件，如果機器人找到這個文件，它就會根據(jù)這個文件的內(nèi)容，來確定它訪問權(quán)限的范圍。

見示例:

1.robots.txt文件的格式?

"robots.txt"文件包含一條或更多的記錄，這些記錄通過空行分開（以CR,CR/NL, or NL作為結(jié)束符），每一條記錄的格式如下所示：
"<field>:<optionalspace><value><optionalspace>"。

在該文件中可以使用#進行注解，具體使用方法和UNIX中的慣例一樣。該文件中的記錄通常以一行或多行User-agent開始，后面加上若干Disallow行,詳細情況如下：

User-agent:
　　該項的值用于描述搜索引擎robot的名字，在"robots.txt"文件中，如果有多條User-agent記錄說明有多個robot會受到該協(xié)議的限制，對該文件來說，至少要有一條User-agent記錄。如果該項的值設(shè)為*，則該協(xié)議對任何機器人均有效，在"robots.txt"文件中，"User-agent:*"這樣的記錄只能有一條。

Disallow:
　　該項的值用于描述不希望被訪問到的一個URL，這個URL可以是一條完整的路徑，也可以是部分的，任何以Disallow開頭的URL均不會被robot訪問到。例如"Disallow:/help"對/help.html 和/help/index.html都不允許搜索引擎訪問，而"Disallow:/help/"則允許robot訪問/help.html，而不能訪問/help/index.html。任何一條Disallow記錄為空，說明該網(wǎng)站的所有部分都允許被訪問，在"/robots.txt"文件中，至少要有一條Disallow記錄。如果"/robots.txt"是一個空文件，則對于所有的搜索引擎robot，該網(wǎng)站都是開放的。

4.robots.txt文件用法舉例

本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊一鍵舉報。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻花（0） +1

來自：素行 > 《Java Spider》

舉報/認(rèn)領(lǐng)

0條評論

請遵守用戶評論公約

類似文章 更多

素行

關(guān)注對話

TA的最新館藏

如何做好一個垂直搜索引擎
什么是垂直搜索？[原創(chuàng)] 中文全文檢索網(wǎng)
信息檢索的核心支撐技術(shù) 中文全文檢索網(wǎng)
信息檢索評測技術(shù)概述
[轉(zhuǎn)] 1分30秒變真真正正XP正版(經(jīng)典)
[轉(zhuǎn)] [學(xué)習(xí)技巧]77種方法，幫你學(xué)得更快更好

喜歡該文的人也喜歡更多

熱門閱讀換一換