日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

得到網(wǎng)頁的最新更新時間

 ShangShujie 2010-05-08
zhengyun_ustc博客專家 發(fā)表于2007年3月29日 23:09:10  IP:舉 報回復(fù)
Incremental Web Search-Tracking Changes in the Web.pdf
這篇論文不知你看過沒有?也許有啟發(fā)。
zhengyun_ustc博客專家 發(fā)表于2007年3月29日 23:10:53  IP:舉 報回復(fù)
其實(shí)獲取http header最簡單的就是用perl,幾句話就搞定:
use LWP::UserAgent;
my $ua = new LWP::UserAgent;
$ua->timeout(120);
my $url='http://blog.donews.com/banly/';
my $response = $ua->head($url);
if ($response->is_success) {
print $response->as_string."----";
}
zhengyun_ustc博客專家 發(fā)表于2007年3月29日 23:14:11  IP:舉 報回復(fù)
1:
你只給對方web服務(wù)器發(fā)送head命令,對方就不會給你網(wǎng)頁所有數(shù)據(jù),而僅僅是http header信息,很短。很多爬蟲就是這么做的,不占用太多流量,就可以知道對方網(wǎng)頁有否更新。
2:
100%得知對方更新是不可能的。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多