欧洲国产视频_自拍视频在线_www.精品_国产小视频免费_日韩在线_av黄色天堂

史上最全面的百度蜘蛛詳解 你不得不看!

作者:劉宇凡 來源: 2012-11-09 16:56:37 閱讀 我要評論 直達商品

一、什么是Baiduspider?
Baiduspider百度搜索引擎的一個自動程序,它的作用是訪問互聯網上的網頁,建立索引數據庫,使用戶能在百度搜索引擎中搜索到您網站上的網頁。


11.png

二、Baiduspider的user-agent是什么?
百度各個產品使用不同的user-agent:
產品名稱 對應user-agent
無線搜索 Baiduspider
圖片搜索 Baiduspider-image
視頻搜索 Baiduspider-video
新聞搜索 Baiduspider-news
百度搜藏 Baiduspider-favo
百度聯盟 Baiduspider-cpro
商務搜索 Baiduspider-ads
網頁以及其他搜索 Baiduspider


三、Baiduspider對一個網站服務器造成的訪問壓力如何?
為了達到對目標資源較好的檢索效果,Baiduspider需要對您的網站保持一定量 的抓取。我們盡量不給網站帶來不合理的負擔,并會根據服務器承受能力,網站質量,網站更新等綜合因素來進行調整。如果您覺得baiduspider的訪問 行為有任何不合理的情況,您可以反饋至百度投訴平臺。


四、為什么Baiduspider不停的抓取我的網站?
對于您網站上新產生的或者持續更新的頁面,Baiduspider會持續抓取。此外, 您也可以檢查網站訪問日志中Baiduspider的訪問是否正常,以防止有人惡意冒充Baiduspider來頻繁抓取您的網站。 如果您發現Baiduspider非正常抓取您的網站,請通過投訴平臺反饋給我們,并請盡量給出Baiduspider對貴站的訪問日志,以便于我們跟蹤 處理。


五、如何判斷是否冒充Baiduspider的抓取?
建議您使用DNS反查方式來確定抓取來源的ip是否屬于百度,根據平臺不同驗證方法不同,如linux/windows/os三種平臺下的驗證方法分別如下:
1,在linux平臺下,您可以使用host ip命令反解ip來判斷是否來自Baiduspider的抓取。Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即為冒充。
$ host 123.125.66.120
120.66.125.123.in-addr.arpa domain name pointer
baiduspider-123-125-66-120.crawl.baidu.com.
host 119.63.195.254
254.195.63.119.in-addr.arpa domain name pointer
BaiduMobaider-119-63-195-254.crawl.baidu.jp.
2,在windows平臺或者IBM OS/2平臺下,您可以使用nslookup ip命令反解ip來 判斷是否來自Baiduspider的抓取。打開命令處理器 輸入nslookup xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 來判斷是否來自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即為冒充。
3,在mac os平臺下,您可以使用dig 命令反解ip來 判斷是否來自Baiduspider的抓取。打開命令處理器 輸入dig xxx.xxx.xxx.xxx(IP地 址)就能解析ip,來判斷是否來自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即為冒充。


六、我不想我的網站被Baiduspider訪問,我該怎么做?
Baiduspider遵守互聯網robots協議。您可以利用robots.txt 文件完全禁止Baiduspider訪問您的網站,或者禁止Baiduspider訪問您網站上的部分文件。 注意:禁止Baiduspider訪問您的網站,將使您的網站上的網頁,在百度搜索引擎以及所有百度提供搜索引擎服務的搜索引擎中無法被搜索到。關于 robots.txt的寫作方法,請參看我們的介紹:robots.txt寫作方法
您可以根據各產品不同的user-agent設置不同的抓取規則,如果您想完全禁止百度所有的產品收錄,可以直接對Baiduspider設置禁止抓取。
以下robots實現禁止所有來自百度的抓取:
User-agent: Baiduspider
Disallow: /
以下robots實現禁止所有來自百度的抓取但允許圖片搜索抓取/image/目錄:
User-agent: Baiduspider
Disallow: /
User-agent: Baiduspider-image
Allow: /image/
請注意:Baiduspider-cpro抓取的網頁并不會建入索引,只是執行與客戶約定的操作,所以不遵守robots協議,如果Baiduspider-cpro給您造成了困擾,請聯系[email protected]
Baiduspider-ads抓取的網頁并不會建入索引,只是執行與客戶約定的操作,所以不遵守robots協議,如果Baiduspider-ads給您造成了困擾,請聯系您的客戶服務專員。


七、為什么我的網站已經加了robots.txt,還能在百度搜索出來?
因為搜索引擎索引數據庫的更新需要時間。雖然Baiduspider已經停止訪問您網站上的網頁,但百度搜索引擎數據庫中已經建立的網頁索引信息,可能需要數月時間才會清除。另外也請檢查您的robots配置是否正確。
如果您的拒絕被收錄需求非常急迫,也可以通過投訴平臺反饋請求處理。


八、我希望我的網站內容被百度索引但不被保存快照,我該怎么做?
Baiduspider遵守互聯網meta robots協議。您可以利用網頁meta的設置,使百度顯示只對該網頁建索引,但并不在搜索結果中顯示該網頁的快照。
和robots的更新一樣,因為搜索引擎索引數據庫的更新需要時間,所以雖然您已經在網頁中通過meta禁止了百度在搜索結果中顯示該網頁的快照,但百度搜索引擎數據庫中如果已經建立了網頁索引信息,可能需要二至四周才會在線上生效。


九、Baiduspider抓取造成的帶寬堵塞?
Baiduspider的正常抓取并不會造成您網站的帶寬堵塞,造成此現象可能是由于 有人冒充Baiduspider惡意抓取。如果您發現有名為Baiduspider的agent抓取并且造成帶寬堵塞,請盡快和我們聯系。您可以將信息反 饋至投訴平臺,如果能夠提供您網站該時段的訪問日志將更加有利于我們的分析。
本文由壓力開關(http://www.shmind.com)網編整理發表,轉載請保留!

  推薦閱讀

  深圳客資訊網CEO崔頌:我眼中的鼎能移動電源

在生活之中,出去旅游,工作,出差的時候,人們都遇到手機充電的難題,然而,誕生了移動電源,在移動電源行業硝煙四起,行業老大都想成為移動電源的贏家的時候,突然半路殺出了由聯創社,中國大學教父孫斌領導的《鼎>>>詳細閱讀


本文標題:史上最全面的百度蜘蛛詳解 你不得不看!

地址:http://www.xglongwei.com/a/xie/20121109/88068.html

樂購科技部分新聞及文章轉載自互聯網,供讀者交流和學習,若有涉及作者版權等問題請及時與我們聯系,以便更正、刪除或按規定辦理。感謝所有提供資訊的網站,歡迎各類媒體與樂購科技進行文章共享合作。

網友點評
我的評論: 人參與評論
驗證碼: 匿名回答
網友評論(點擊查看更多條評論)
友情提示: 登錄后發表評論,可以直接從評論中的用戶名進入您的個人空間,讓更多網友認識您。
自媒體專欄

評論

熱度

主站蜘蛛池模板: 久久这里只有精品66re99 | 久久精品国产大片免费观看 | 不卡视频免费在线观看 | 九九精品99久久久香蕉 | 狠狠躁夜夜躁人人爽天天 | 日本一区二区三区在线观看 | 亚州人成网在线播放 | 黄色短视频免费在线观看 | 国产自产 | 精品啪啪 | 大杳焦伊人久久综合热 | 日韩视频久久 | 九九热视频这里只有精品 | 日本无吗免费一二区 | 精品久久成人 | 女啪啪www女高清 | 免费xxxx | 亚洲五月网 | 青青草精品在线视频 | 国产jizzjizz | 女人色毛茸茸视频 | jizz免费观看 | 午夜色福利 | 国产成人a在一区线观看高清 | 热99re久久精品精品免费 | 欧美一区二区三区免费高 | 亚洲最新永久观看在线 | 97精品国产91久久久久久久 | 天天操天天摸天天干 | 欧美一区综合 | 99久久免费国产精品 | 久久手机精品视频 | 欧美日韩国产超高清免费看片 | α片免费看| 伊人狠狠干 | 日本道v高清免费 | 韩国三级a | 97精品国产 | 色天天色综合 | 色色视频免费网 | 国产精品扒开做爽爽爽的视频 |