如何查看自己網站(zhàn)是否有(yǒu)蜘蛛來(lái)過

2020-04-05 11:34:20 編輯:永諾網絡 來(lái)源:本站(zhàn)原創
什麽是baiduspider?
baiduspider是百度搜引擎的一個(gè)自動程序。它的作(zuò)用是訪問互聯網上(shàng)的html網頁,建立索引數(shù)據庫,使用戶能在度搜索引中搜索到您網站(zhàn)的網頁。
如何查看自己網站(zhàn)是否有(yǒu)蜘蛛來(lái)過
baiduspider對一個(gè)網站(zhàn)服務器(qì)造成的訪問壓力如何?
baiduspider會(huì)自動根據服務器(qì)的負載能力調節訪問密度。在連續訪問一段時(shí)間(jiān)後,baiduspider會(huì)暫停一會(huì),以防止增大(dà)服務器(qì)的訪問壓力。所以在一般情況下,baiduspider對您網站(zhàn)的服務器(qì)不會(huì)造成過大(dà)壓力。

為(wèi)什麽baiduspider不停的抓取的網站(zhàn)
對于您網站(zhàn)上(shàng)新産生(shēng)的或者持續更新的頁面,baiduspider會(huì)持續抓取。此外,您也可(kě)以檢查網站(zhàn)訪問日志(zhì)中baiduspider的訪問是否正常,以防止有(yǒu)人(rén)惡意冒充baiduspider來(lái)頻繁抓取您的網站(zhàn)。 如果您發現baiduspider非正常抓取您的網站(zhàn),請(qǐng)反饋至webmaster@baidu.com,并請(qǐng)盡量給出baiduspider對貴站(zhàn)的訪問日志(zhì),以便于我們跟蹤處理(lǐ)。

我不想的網站(zhàn)被baiduspider訪問,我該怎麽做(zuò)?
baiduspider遵守互聯網robots。您可(kě)以利用robots.txt文件完全禁止baiduspider訪問您的網站(zhàn),或者禁止baiduspider訪問您網站(zhàn)上(shàng)的部分文件。 注意:禁止baiduspider訪問您的網站(zhàn),将使您的網站(zhàn)上(shàng)的網頁,在百度搜索引擎以及所有(yǒu)百度提供搜索引擎服務的搜索引擎中無法被搜索到。
關于robots.txt的寫作(zuò)方法,請(qǐng)參看我們的介紹:robots.txt寫作(zuò)方法

為(wèi)什麽網站(zhàn)已經加了robots.txt,還(hái)能在百度搜索出來(lái)?
因為(wèi)搜索引擎索引數(shù)據庫的更新需要時(shí)間(jiān)。雖然baiduspider已經停止訪問您網站(zhàn)上(shàng)的網頁,但(dàn)百度搜索引擎數(shù)據庫中已經建立的網頁索引信息,可(kě)能需要二至四周才會(huì)清除。 另外也請(qǐng)檢查您的robots配置是否正确。

蜘蛛在robots.txt中的名字是什麽?
“baiduspider”全部為(wèi)小(xiǎo)寫字母。

baiduspider多(duō)長時(shí)間(jiān)之後會(huì)重新抓取我的網頁?
百度搜索引擎每周更新,網頁視(shì)重要性有(yǒu)不同的更新率,頻率在幾天至一月之間(jiān),baiduspider會(huì)重新訪問和(hé)更新一個(gè)網頁。

知道(dào)了什麽是百度,那(nà)麽怎麽才能知道(dào)蜘蛛是否來(lái)過你(nǐ)的站(zhàn)?這個(gè)可(kě)以從你(nǐ)服務器(qì)或者虛拟主機的日志(zhì)中看出來(lái),比如我用的虛拟主機的完整使用日志(zhì)中有(yǒu)這樣的記錄:

220.181.38.198 - - [11/Nov/2007:04:28:29 +0800] "GET / HTTP/1.1" 200 61083 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)"這就說明(míng)蜘蛛來(lái)過我的站(zhàn)了,如果你(nǐ)還(hái)想知道(dào)有(yǒu)沒有(yǒu)其它搜索引擎的蜘蛛來(lái)過你(nǐ)的站(zhàn),你(nǐ)可(kě)以在日志(zhì)文件中搜索“spider”這個(gè)詞,或者搜索蜘蛛的IP,我的就查到sogou也來(lái)過我的站(zhàn),IIS日志(zhì)與Apache的日志(zhì)是一樣的,都可(kě)以查到。
本站(zhàn)文章均為(wèi)永諾網站(zhàn)建設摘自權威資料,書(shū)籍,或網絡原創文章,如有(yǒu)版權糾紛或者違規問題,請(qǐng)即刻聯系我們删除,我們歡迎您分享,引用和(hé)轉載,我們謝絕直接複制(zhì)和(hé)抄襲!感謝...
我們猜你(nǐ)喜歡