百度快照
如果無(wú)法打開(kāi)某個(gè)搜索結(jié)果,或者打開(kāi)速度特別慢,該怎么辦?“百度快照”能幫您解決問(wèn)題。每個(gè)被收錄的網(wǎng)頁(yè),在百度上都存有一個(gè)純文本的備份,稱(chēng)為“百度快照”。百度速度較快,您可以通過(guò)“快照”快速瀏覽頁(yè)面內(nèi)容。不過(guò),百度只保留文本內(nèi)容,所以,那些圖片、音樂(lè)等非文本信息,快照頁(yè)面還是直接從原網(wǎng)頁(yè)調(diào)用。如果您無(wú)法連接原網(wǎng)頁(yè),那么快照上的圖片等非文本內(nèi)容,會(huì)無(wú)法顯示。

如何解決網(wǎng)站標(biāo)題、描述快照顯示不正常
一、robots.txt文件
一般來(lái)說(shuō),出現(xiàn)這種情況就是當(dāng)Robots.txt中設(shè)置某一個(gè)特定URL為“nofollow、noindex”,雖然這個(gè)指令告訴搜索引擎不要跟蹤,以及收錄這條鏈接。但是如果有一定數(shù)量的外鏈指向這條鏈接,搜索引擎也許會(huì)收錄該URL。而此時(shí)的標(biāo)題則有可能為URL,描述則為空。當(dāng)然,出現(xiàn)這種情況多為GOOGLE搜索引擎。百度收錄“nofollow、noindex”鏈接比較罕見(jiàn),但也不排除這個(gè)可能。
筆者在前一個(gè)月給客戶優(yōu)化一個(gè)站,也曾出現(xiàn)過(guò)此問(wèn)題,就是因?yàn)閞obots.txt文件被修改,造成網(wǎng)站標(biāo)題、描述快照不完整,一直在找原因處理了好幾天不見(jiàn)效果,也沒(méi)想到會(huì)是robots.txt的問(wèn)題,后來(lái)不經(jīng)意之間才發(fā)現(xiàn),于是立馬修改過(guò)來(lái)。于是,第二天網(wǎng)站就恢復(fù)正常,所以,建議出現(xiàn)此問(wèn)題的朋友,一定要檢查好robots.txt文件。
二、網(wǎng)站內(nèi)容及標(biāo)題的改動(dòng)
這是比較嚴(yán)重的情況,比如你的網(wǎng)站的標(biāo)題、描述、或URL路徑做了全部或大部分的修改調(diào)整后。這樣會(huì)造成大量的死頁(yè)面,就會(huì)失去搜索引擎的信任,當(dāng)頁(yè)面從搜索引擎消失以后,由于以前給該頁(yè)面做外部鏈接,搜索引擎又開(kāi)始收錄這個(gè)頁(yè)面,這個(gè)時(shí)候描述也極有可能是為空的。
在網(wǎng)站改版或大范圍改動(dòng)后,建議最好設(shè)置好robots禁止抓取錯(cuò)誤頁(yè)面及404錯(cuò)誤頁(yè)面的制作,這樣一方面可以降低用戶流失,另一方面可以告訴蜘蛛這是一個(gè)錯(cuò)誤的的地址,禁止蜘蛛抓取不存在的網(wǎng)頁(yè),在此期間保持為網(wǎng)站更新原創(chuàng)內(nèi)容及高質(zhì)量的外鏈。
三、百度對(duì)數(shù)據(jù)的抓取能力不夠
據(jù)觀察,出現(xiàn)這種情況主要是百度對(duì)數(shù)據(jù)的抓取能力不夠強(qiáng)。尤其是使用CDN的網(wǎng)站,一般來(lái)說(shuō)百度爬蟲(chóng)緩存域名對(duì)應(yīng)服務(wù)器IP的時(shí)間是超過(guò)1天,蜘蛛爬網(wǎng)站的時(shí)候,沒(méi)有按照dns協(xié)議去緩存dns記錄,而是緩存dns記錄1天以上,所以當(dāng)CDN換了IP,百度蜘蛛在一天內(nèi)會(huì)還一直爬不能訪問(wèn)的舊服務(wù)器IP。這樣就會(huì)造成某個(gè)節(jié)點(diǎn)的數(shù)據(jù)不能被抓取的現(xiàn)象,從而出現(xiàn)網(wǎng)站標(biāo)題和描述不能正常顯示。

















