百度蜘蛛是什么?百度蜘蛛,英文名是“baiduspider”是百度搜索引擎的一個自動程序。它的作用是訪問互聯(lián)網上的html網頁,建立索引數(shù)據庫,使用戶能在百度搜索引擎中搜索到您網站的網頁。圍繞著以下八點讓我們更加深入的了解百度蜘蛛。
1.Baiduspider對一個網站服務器造成的訪問壓力
Baiduspider會自動根據服務器的負載能力調節(jié)訪問密度。在連續(xù)訪問一段時間后,Baiduspider會暫停一會,以防止增大服務器的訪問壓力。所以在一般情況下,Baiduspider對您網站的服務器不會造成過大壓力。
2.Baiduspider的抓取問題
對于網站上新產生的或者持續(xù)更新的頁面,Baiduspider會持續(xù)抓取。此外,也可以檢查網站訪問日志中Baiduspider的訪問是否正常,以防止有人惡意冒充Baiduspider來頻繁抓取網站。 如果您發(fā)現(xiàn)Baiduspider非正常抓取您的網站,請反饋至webmaster@baidu.com,并請盡量給出Baiduspider對貴站的訪問日志,以便于我們跟蹤處理。
3.如何禁止Baiduspider訪問
Baiduspider遵守互聯(lián)網robots協(xié)議??梢岳胷obots.txt文件完全禁止Baiduspider訪問您的網站,或者禁止Baiduspider訪問網站上的部分文件。 注意:禁止Baiduspider訪問您的網站,將使您的網站上的網頁,在百度搜索引擎以及所有百度提供搜索引擎服務的搜索引擎中無法被搜索到。ps:關于robots.txt的寫作方法,請參看我們的介紹:robots.txt寫作方法
4.關于robots.txt
為什么網站已經加了robots.txt,還能在百度搜索出來?因為搜索引擎索引數(shù)據庫的更新需要時間。雖然Baiduspider已經停止訪問您網站上的網頁,但百度搜索引擎數(shù)據庫中已經建立的網頁索引信息,可能需要二至四周才會清除。 另外也請檢查您的robots配置是否正確。
5.網站內容被百度索引但不被保存快照,該怎么做?
Baiduspider遵守互聯(lián)網meta robots協(xié)議。您可以利用網頁meta的設置,使百度顯示只對該網頁建索引,但并不在搜索結果中顯示該網頁的快照?! 『蛂obots的更新一樣,因為搜索引擎索引數(shù)據庫的更新需要時間,所以雖然您已經在網頁中通過meta禁止了百度在搜索結果中顯示該網頁的快照,但百度搜索引擎數(shù)據庫中如果已經建立了網頁索引信息,可能需要二至四周才會在線上生效。
6.百度蜘蛛在robots.txt中的名字
“Baiduspider” 首字母B大寫,其余為小寫。
7.Baiduspider多長時間之后會重新抓取我的網頁?
百度搜索引擎每周更新,網頁視重要性有不同的更新率,頻率在幾天至一月之間,Baiduspider會重新訪問和更新一個網頁。
8.Baiduspider抓取造成的帶寬堵塞?
Baiduspider的正常抓取并不會造成您網站的帶寬堵塞,造成此現(xiàn)象可能是由于有人冒充baidu的spider惡意抓取。如果您發(fā)現(xiàn)有名為Baiduspider的agent抓取并且造成帶寬堵塞,請盡快和我們聯(lián)系。您可以將信息反饋至百度網頁投訴中心,如果能夠提供您網站該時段的訪問日志將更加有利于我們的分析。