比來擔任一個年夜中型英文網站的第三方seo參謀,因為某些原因,網站某部門的URL需要更改,呈現幾十萬頁面級此外301和404。若何才能統計到新頁面被Google索引了沒?其實可以操作Google打點員工具,就可以統計到這些新頁面被Google索引了若干好多,而且還可以斗勁切確地獲得網站整體在Google里的索引量。
以我的博客為例,直接site我的博客找到486條結不美觀,而我的博客今朝只有72篇文章,加上分類頁面也相差好幾百。原因是早段時刻改換主機,自己 年夜頭哈健忘上傳robots.txt,導致一些一再內容頁面也收錄了,后來才上傳了robots.txt。此刻Google “site:yihuiblog.com”就會呈現如下的收錄,只有網址沒有內容(過一段時刻才會刪除)。

網站會呈現良多的問題,造成搜索引擎索引一些站長不想索引的頁面,搜羅常見的一再內容頁面、無限輪回頁面(日常平常我們還要盡量找出這些鏈接屏障失蹤和到Google打點員工具里刪除),年夜中型網站就加倍普遍。但這些索引數據對seo剖析生發火用年夜么?不年夜,甚至等于0。
其實可以在Google打點員工具Sitemap模塊里獲得“真實”的收錄數據,這個“真實”取決于你想讓哪些頁面被Google索引。此刻我想知 道我博客分袂有若干好多文章和分類頁面被索引,首先我建造兩個網站地圖文件,一個包含所有文章地址(URL),一個包含所有分類地址,然后在打點員工具提交 sitemap地址。
Google打點員工具后臺直接提交比robots.txt寫入地圖地址要好,一方面加倍矯捷,一方面可以防止競爭對手獲取站點數據進行研究。
因為演示,追求簡單,這里我只建造了文當地圖文件,主流搜索引擎撐持RSS、Atom、XML和文本等多種名目的地圖文件,Google撐持一個站點地圖文件最多包含 5 萬個網址,壓縮前體積不得跨越 50MB。

上圖顯示Google索引了一灰博客的72個文章頁面和22個分類頁面。按照需求拆分網站地圖文件,可以便利獲得你想要的索引數據,而且可以提交重疊的網址,例如同時提交網站最新更新產物的網頁地址和某分類下產物的網頁地址(存在重疊網址)。獲得收錄數據,就可以有針對性地進行優化。例如優化持久不索引的頁面,等Google蜘蛛下次爬行后進行索引,也可以與同期其他seo數據進行融合,獲得更多對seo有輔佐的數據。其實Google在site的時辰已經明晰Google打點員工具這一功能,只是良多人沒有進一步操作。
操作好Google打點員工具,可以抽離出更多對seo有用的數據,往后再慢慢切磋。Bing打點員工具也有良多適用的數據,同樣不要錯過哦。
原文地址:http://yihuiblog.com/a/299.html