影(yǐng)響蜘蛛抓取頁面的因素都有(yǒu)哪些(xiē)

2020-03-29 14:45:02 編輯:永諾網絡 來(lái)源:本站(zhàn)原創
  網站(zhàn)收錄與百度蜘蛛有(yǒu)着直接的關系,我們平時(shí)主要是通(tōng)過主動或被動的方式來(lái)吸引百度蜘蛛抓取網站(zhàn)頁面。主動的方式就是通(tōng)過站(zhàn)長平台的鏈接提交工具或其它插件,來(lái)将自己網站(zhàn)新的內(nèi)容鏈接提交給搜索引擎。被動的方式是靠搜索引擎蜘蛛自己來(lái)爬取,來(lái)的時(shí)間(jiān)不一定。

  據我們所知,百度蜘蛛有(yǒu)兩個(gè)目标:一個(gè)是本網站(zhàn)生(shēng)成的新網頁,另一個(gè)是百度之前已抓取但(dàn)需要更新的網頁。

  影(yǐng)響百度蜘蛛抓取網站(zhàn)頁面的因素有(yǒu)哪些(xiē)

  1、robots協議設置:網站(zhàn)上(shàng)線後roblts協議文件是搜索引擎第一個(gè)查看的文件,如果不小(xiǎo)心設置錯誤禁止搜索引擎就會(huì)導緻,搜索引擎蜘蛛無法抓取網站(zhàn)頁面。

  2、內(nèi)容質量

  此外,網站(zhàn)內(nèi)容的質量也非常重要。如果蜘蛛在我們的網站(zhàn)上(shàng)抓取了100,000條內(nèi)容,并且隻構建了100條或更少(shǎo)的內(nèi)容,那(nà)麽百度蜘蛛也會(huì)減少(shǎo)網站(zhàn)的抓取量。因為(wèi)百度認為(wèi)我們的網站(zhàn)質量很(hěn)差,所以沒有(yǒu)必要抓住更多(duō)。因此,我們特别提醒您在站(zhàn)點建設之初需要注意內(nèi)容的質量,不要收集內(nèi)容。這對網站(zhàn)的發展有(yǒu)潛在的隐患。

  3、服務器(qì)不穩定:服務器(qì)不穩定或者JS添加過多(duō),就會(huì)導緻網站(zhàn)加載速度變慢,甚至無法打開(kāi),嚴重影(yǐng)響用戶體(tǐ)驗,這種情況也會(huì)影(yǐng)響百度蜘蛛抓取網站(zhàn)頁面的。
影(yǐng)響蜘蛛抓取頁面
  4、網站(zhàn)安全

  對于中小(xiǎo)型站(zhàn)點,由于缺乏安全技(jì)術(shù)意識和(hé)技(jì)術(shù)弱點,網站(zhàn)被篡改是很(hěn)常見的。有(yǒu)幾種常見的黑(hēi)客攻擊情況。一個(gè)是網站(zhàn)域名被黑(hēi)客攻擊,另一個(gè)是标題被篡改,另一個(gè)是頁面中添加了很(hěn)多(duō)黑(hēi)鏈。對于一般網站(zhàn),域名被劫持,即域名設置為(wèi)301跳(tiào)轉,并跳(tiào)轉到指定的垃圾郵件網站(zhàn)。如果百度發現這種跳(tiào)躍,那(nà)麽你(nǐ)網站(zhàn)的抓取就會(huì)減少(shǎo),甚至會(huì)減少(shǎo)懲罰。

  5、網站(zhàn)響應速度快

  ①網頁的大(dà)小(xiǎo)将影(yǐng)響抓取。百度建議網頁的大(dà)小(xiǎo)不到1M,當然類似于新浪網這樣的大(dà)型門(mén)戶網站(zhàn)。

  ②代碼質量,機器(qì)性能和(hé)帶寬。這些(xiē)會(huì)影(yǐng)響抓取的質量。不用說,代碼本身的質量也根據程序執行(xíng)。您的代碼質量差,難以閱讀。蜘蛛自然不會(huì)浪費時(shí)間(jiān)閱讀。機器(qì)性能和(hé)帶寬也是如此。服務器(qì)配置太差,帶寬不足會(huì)導緻蜘蛛抓取網站(zhàn),這将嚴重影(yǐng)響蜘蛛的熱情。

  6、具有(yǒu)相同ip的網站(zhàn)數(shù)量

  百度抓取是基于ip抓取的。例如,百度每天可(kě)以在ip上(shàng)捕獲2000w頁面,并且該站(zhàn)點上(shàng)有(yǒu)50W站(zhàn)點,因此将抓取平均站(zhàn)點數(shù)量。很(hěn)少(shǎo)點。同時(shí),你(nǐ)需要注意看同一個(gè)ip上(shàng)是否有(yǒu)一個(gè)大(dà)站(zhàn)。如果有(yǒu)一個(gè)大(dà)站(zhàn),那(nà)麽分配很(hěn)少(shǎo)的抓取數(shù)量将被大(dà)站(zhàn)帶走。

  影(yǐng)響網站(zhàn)收錄的因素是各方面的,在查找原因的時(shí)候可(kě)采用排查法,一項一項的查找,隻有(yǒu)查找到了原因才能提升網站(zhàn)收錄。同時(shí)提醒大(dà)家(jiā)一點:搜索引擎的索引庫是分級别的,網站(zhàn)內(nèi)容被收錄後,如果內(nèi)容質量度高(gāo)就會(huì)進入優質索引庫,并給于優先展示,因此網站(zhàn)收錄并不是量大(dà)就是好。
本站(zhàn)文章均為(wèi)永諾網站(zhàn)建設摘自權威資料,書(shū)籍,或網絡原創文章,如有(yǒu)版權糾紛或者違規問題,請(qǐng)即刻聯系我們删除,我們歡迎您分享,引用和(hé)轉載,我們謝絕直接複制(zhì)和(hé)抄襲!感謝...
我們猜你(nǐ)喜歡