聲明:以下均來自百度官方及相關(guān)人員的解答。 1.為什么蜘蛛天天來,而快照不更新呢? 官方解答:蜘蛛天天來,你需要看蜘蛛是否只爬不抓,如果只爬不抓說明內(nèi)容還是存在問題的,要加大原創(chuàng)力度,或者說蜘蛛是否很難抓取,另外蜘蛛來了也抓取了也不會(huì)很快就更新,這之間是有一個(gè)過程的,蜘蛛需要對(duì)抓取的內(nèi)容進(jìn)行判斷,并且快照也有一個(gè)緩存時(shí)間。一般情況下我們需要注意: 1、網(wǎng)站是否被降權(quán),要是網(wǎng)站被降權(quán)了,要是網(wǎng)站被降權(quán)了,在搜索引擎那里屬于審核期,網(wǎng)站快照更新慢或不更新是很正常的。 2、網(wǎng)站是否被掛黑鏈,被掛大量黑鏈的網(wǎng)站也經(jīng)常會(huì)快照不更新,需要定期查看網(wǎng)站是否被掛黑鏈。 3、網(wǎng)站速度問題,網(wǎng)站的加載速度會(huì)影響蜘蛛的正常抓取,一般情況下網(wǎng)站都是從上往下的加載,而有的時(shí)候由于速度因素導(dǎo)致網(wǎng)站只加載了頭部,后面部分而沒有及時(shí)顯示出來,也可能導(dǎo)致蜘蛛只抓取了頭部部分內(nèi)容,而由于一般網(wǎng)站的頭部都是相同的,也就容易出現(xiàn)了抓取返回沒更新的狀態(tài)碼。 4、網(wǎng)站內(nèi)容問題 網(wǎng)站內(nèi)容長(zhǎng)期采集或是偽原創(chuàng)也能導(dǎo)致蜘蛛返回304狀態(tài)碼,因?yàn)榫W(wǎng)站內(nèi)容采集或偽原創(chuàng)的確會(huì)降低網(wǎng)站質(zhì)量,導(dǎo)致百度不收錄等情況,搜索蜘蛛也會(huì)認(rèn)為網(wǎng)站內(nèi)容不具備收錄的意義,那么也就不會(huì)抓取新的內(nèi)容而返回沒有更新的狀態(tài)。 5、長(zhǎng)時(shí)間不更新,頁面長(zhǎng)時(shí)間沒有更新也會(huì)導(dǎo)致快照不更新的情況,你不是高權(quán)重網(wǎng)站,也沒有大量其他外部來源,如果又長(zhǎng)時(shí)間不更新,那么很可能就不更新快照。 6、蜘蛛問題,蜘蛛天天來,那來的到底是些什么蜘蛛呢?不是所有的蜘蛛來網(wǎng)站都會(huì)更新的,降權(quán)也說不定,所以我們需要分析網(wǎng)站日志,了解搜索引擎蜘蛛。 7、網(wǎng)頁上有時(shí)間戳,然后時(shí)間戳代碼長(zhǎng)期沒更新產(chǎn)生了快照異常。 8、百度問題,有的時(shí)候百度在更新之后會(huì)出現(xiàn)一些問題,導(dǎo)致失誤,所以可以到百度快照投訴進(jìn)行申訴。 9、百度會(huì)篩選一個(gè)最合適的快照進(jìn)行展現(xiàn),如果你的最新的索引快照不如之前的好,那么還是會(huì)展現(xiàn)之前的快照。 后來經(jīng)過分析,發(fā)現(xiàn)是因?yàn)榫W(wǎng)頁上的時(shí)間戳問題,經(jīng)過修改和更新后恢復(fù)正常。 2.新網(wǎng)站、老域名如何才能讓百度快速收錄? 官方解答:首先了解該域名之前的內(nèi)容,排除老域名因內(nèi)容原因被百度懲罰。然后觀察Baiduspider來訪軌跡,確定是否有蜘蛛進(jìn)行抓取。再看一下網(wǎng)頁狀態(tài)碼返回是否符合預(yù)期。如果都沒有問題,可以嘗試通過url提交工具h(yuǎn)ttp://zhanzhang.baidu.com/sitesubmit/index申請(qǐng)百度抓取。 3.網(wǎng)站不做偽靜態(tài)對(duì)收錄有沒有影響? 官方解答:對(duì)于不復(fù)雜的動(dòng)態(tài)url,百度都可以搞定。 4.偽原創(chuàng)內(nèi)容對(duì)網(wǎng)站是否有壞處? 官方解答:視內(nèi)容對(duì)用戶的價(jià)值,無價(jià)值的純粹的偽原創(chuàng)是會(huì)被打擊的。 5.我們的原創(chuàng)內(nèi)容被XX網(wǎng)站采集,他們是新聞源,但我們不是,這種情況該怎么辦? 官方解答:百度傾向于收錄原創(chuàng)的新聞內(nèi)容。 如果確實(shí)有此情況,可以向站長(zhǎng)平臺(tái)的投訴反饋中心提交反饋。前提是你的網(wǎng)站不是因?yàn)楸缓?、軟文等低質(zhì)內(nèi)容被懲罰。 6.網(wǎng)站title關(guān)鍵詞順序,是否影響排名? 官方解答:不影響。 7.純文本鏈接和錨文本鏈接,效果方面有啥區(qū)別? 官方解答:純文本還是錨文本并不重要,重要的是是否出現(xiàn)在有相關(guān)度的頁面上,百度現(xiàn)在對(duì)外鏈的依賴上已經(jīng)很少了,研究這個(gè)意義不大。 8. 如果收錄都被建入低層庫的話,怎么辦?如何提升上來呢? 官方解答:主要 問題在于內(nèi)容質(zhì)量。 好網(wǎng)頁:無論從網(wǎng)站結(jié)構(gòu)、怎么利于爬蟲抓取,還是從用戶體驗(yàn),用戶需求方面回答的始終有非常多信息來說明??梢詺w結(jié)為爬蟲與用戶。 眾所周知,搜索引擎的索引庫是分層級(jí)的,優(yōu)質(zhì)的網(wǎng)頁會(huì)被分配到重要索引庫,普通網(wǎng)頁會(huì)待在普通庫,再差一些的網(wǎng)頁會(huì)被分配到低級(jí)庫去當(dāng)補(bǔ)充材料。目前60%的檢索需求只調(diào)用重要索引庫即可滿足,這也就解釋了為什么有些網(wǎng)站的收錄量超高流量卻一直不理想。 那么,哪些網(wǎng)頁可以進(jìn)入優(yōu)質(zhì)索引庫呢。其實(shí)總的原則就是一個(gè):對(duì)用戶的價(jià)值。包括卻不僅于: 1,有時(shí)效性且有價(jià)值的頁面:在這里,時(shí)效性和價(jià)值是并列關(guān)系,缺一不可。有些站點(diǎn)為了產(chǎn)生時(shí)效性內(nèi)容頁面做了大量采集工作,產(chǎn)生了一堆無價(jià)值面頁,也是百度不愿看到的. 2,內(nèi)容優(yōu)質(zhì)的專題頁面:專題頁面的內(nèi)容不一定完全是原創(chuàng)的,即可以很好地把各方內(nèi)容整合在一起,或者增加一些新鮮的內(nèi)容,比如觀點(diǎn)和評(píng)論,給用戶更豐富全面的內(nèi)容。 3,高價(jià)值原創(chuàng)內(nèi)容頁面:百度把原創(chuàng)定義為花費(fèi)一定成本、大量經(jīng)驗(yàn)積累提取后形成的文章。千萬不要再問我們偽原創(chuàng)是不是原創(chuàng)。 4,重要個(gè)人頁面:這里僅舉一個(gè)例子,科比在新浪微博開戶了,即使他不經(jīng)常更新,但對(duì)于百度來說,它仍然是一個(gè)極重要的頁面。 9.網(wǎng)站標(biāo)題是完全一致怎么優(yōu)化? 官方解答:最簡(jiǎn)單的方式是每個(gè)頁面使用文章標(biāo)題作為標(biāo)題,并加上網(wǎng)站名稱。 10.百度現(xiàn)在對(duì)URL中出現(xiàn)中文字符仍然不友好嗎? 官方解答:現(xiàn)在中文目錄或者url已經(jīng)基本完美解決了,百度發(fā)表過聲明的,收錄時(shí)候會(huì)自動(dòng)解析中文為編碼收錄的。 使用百度平臺(tái)閉站工具后仍有抓?。?/p> 官方解答:通過反饋中心來反饋 ---------------------------------------------------- 本文由營銷小能手整理 作者:任曉亮 QQ:541098712 營銷小能手公眾微信號(hào):yx-xns 長(zhǎng)按復(fù)制 |
|