1、httrack使用方法 概念介紹: httrack 是一看網(wǎng)站鏡像程序,也叫做扒皮工具。 使用者可以直接把互聯(lián)網(wǎng)上的網(wǎng)站下載到本地計(jì)算機(jī)上,在默認(rèn)的設(shè)置下,httrack對網(wǎng)站的下載方式是按照原站點(diǎn)子昂對的鏈接結(jié)構(gòu)在組織的。httrack使用網(wǎng)絡(luò)爬蟲下載網(wǎng)站,對于用robots.txt的網(wǎng)站,如果不在程序運(yùn)行時取消限制,默認(rèn)設(shè)置下,程序不會把網(wǎng)站完全鏡像,Httrack能夠跟隨基本的JavaScript、或者Applet、flash中的鏈接,但是對于復(fù)雜的鏈接(使用函數(shù)或者表達(dá)式創(chuàng)建的鏈接)或者服務(wù)器端的imageMap 則顯得無能為力。imagemap控件是一個在圖片上定義熱點(diǎn)區(qū)域的控制器,用戶可以點(diǎn)擊這些熱點(diǎn)區(qū)域進(jìn)行回發(fā)(postback)操作或者定向到(navigate)到某一個url該控件主要用在對某張圖片的操作定義屬性有HotSpotMode、HotSpot、Click 最難點(diǎn)通配符的規(guī)則,wildcards(通配符) 舉例子如下: httrack "www.baidu.com" -w -o " *.gif+www.*.com/*.zip-*img_.*zip" -%v httrack "http://xiaomi.blog.163.com" -o /home/back/www/" + ".xiaomi.163.com / * " -v 這里我就拿另一個mirror做例子,形象一點(diǎn),打開一個我已經(jīng)mirror的網(wǎng)站 2、Google搜索指令的應(yīng)用 搜索指令,其實(shí)是根據(jù)不同的搜索引擎的底層設(shè)置來操作的。很多都是通用的,Google搜索指令大多在百度中適用, 詳細(xì)的指令我之前在博客中已經(jīng)寫過,可以查看,重點(diǎn)寫一些常見的 site:指令 網(wǎng)站內(nèi)檢索指令 eg、在蘭州理工大學(xué)中檢索我的名字 site:rjxy.lut.cn/ 我的名字 intitle,和allintitle是針對網(wǎng)頁標(biāo)題中搜索關(guān)鍵字,舉例 在工大計(jì)通學(xué)院中檢索網(wǎng)頁標(biāo)題中含有教授的所用網(wǎng)頁鏈接
inrul:是在網(wǎng)頁鏈接中搜索信息,網(wǎng)址中含有某種字符的鏈接 ,舉例,記住每個檢索字段之間要有空格 cache:指令是另外一個比較重要的指令,可以在引擎快照中搜索信息,舉例在快照中搜索我的信息 filetype:這個我就不解釋啦 3、使用whois命令旨在查詢服務(wù)器信息,舉一列查詢蘭州理工大學(xué)服務(wù)器信息 使用nslookup是查詢電腦連接的一個最近端設(shè)備信息,今天我連接的是校園無線所以了什么都查不出 4、The Harvester挖掘郵箱地址信息,首先安裝theharvester 如下是挖掘西安理工大學(xué)的郵箱,以及隱藏的二級域名,由于涉密安全,自動打碼 另外就是使用whois.net 網(wǎng)站對要查詢的網(wǎng)站域名進(jìn)行挖掘,該網(wǎng)站whois搜索出來具體的服務(wù)器信息,以及額外的信息,另外就是whois提供對url的引用,“url:(referral url:)”字段提供的鏈接地址做進(jìn)一步搜索,利用safename的whois的服務(wù)。 另一個信息搜索的網(wǎng)站就是Netcraft,網(wǎng)站地址: http://news. 最后一個就是dig和host工具的使用,這個我不寫了,百度一下。
|
|