定期更新站內(nèi)的文章幾乎是每一個(gè)網(wǎng)站都會(huì)做的事情,當(dāng)然不是每網(wǎng)站都注重原創(chuàng),也不是每個(gè)網(wǎng)站都愿意花這個(gè)時(shí)間去做原創(chuàng)的文章,不少人就在用采集的方式在更新自己的網(wǎng)站文章。且不說(shuō)大量采集他人文章的網(wǎng)站會(huì)怎么樣,這里根據(jù)筆者自己網(wǎng)站的實(shí)際情況,說(shuō)一說(shuō)長(zhǎng)期處于被他人采集文章的網(wǎng)站會(huì)有什么樣的后果,以及要避免被他人采集的方法。BaiduSpider喜歡原創(chuàng)的東西,但是百度蜘蛛對(duì)于原創(chuàng)源址的判斷目前還無(wú)法做到精準(zhǔn)的地步,它并不能完全自主的判斷某一篇文章它的始發(fā)點(diǎn)是哪里,當(dāng)我們更新一篇文章,并且很快的被他人采集的時(shí)候,蜘蛛可能同一時(shí)間接觸了到很多一摸一樣的文章,那么它就會(huì)很迷茫,并不清楚到底哪個(gè)是原創(chuàng)的,哪些是復(fù)制的。
因此,當(dāng)我們的網(wǎng)站長(zhǎng)期處于被采集的狀態(tài)的時(shí)候,我們網(wǎng)站上更新的文章大部分都在互聯(lián)網(wǎng)上存在一樣的內(nèi)容,而假如網(wǎng)站權(quán)重又不夠高,那么蜘蛛就很可能將你的網(wǎng)站列為采集站,它更相信你網(wǎng)站的文章是采集自互聯(lián)網(wǎng)的,而不是互聯(lián)網(wǎng)當(dāng)中其他的站是采集你的文章。
當(dāng)蜘蛛這樣的看待你的網(wǎng)站的時(shí)候,你網(wǎng)站可能就會(huì)碰到這么幾種情況:
先文章頁(yè)停止收錄,然后整個(gè)網(wǎng)站不收錄
這點(diǎn)是一定會(huì)發(fā)生的,因?yàn)楸话俣日`判為采集站,所以你的文章頁(yè)一定會(huì)被百度列為考察期,在這個(gè)期間,文章頁(yè)是一定會(huì)停止收錄的。當(dāng)然這個(gè)停止收錄不會(huì)只是影響你的文章頁(yè),它也會(huì)讓那個(gè)百度重新審核你整個(gè)網(wǎng)站,所以其他的頁(yè)面也會(huì)漸漸的開(kāi)始不收錄。筆者的網(wǎng)站曾有半個(gè)月沒(méi)有收錄過(guò)一個(gè)頁(yè)面,原因就是因?yàn)檫@個(gè)導(dǎo)致的。
網(wǎng)站收錄開(kāi)始減少,快照停滯
正如前面所說(shuō),百度會(huì)重新對(duì)你的網(wǎng)站進(jìn)行考量,這個(gè)時(shí)候,一定會(huì)發(fā)現(xiàn)你網(wǎng)站存在著一些頁(yè)面和互聯(lián)網(wǎng)當(dāng)中存在類似,百度會(huì)毫不考慮的減少你這些頁(yè)面的收錄,所以很多人發(fā)現(xiàn)網(wǎng)站停止收錄之后,慢慢的引起了網(wǎng)站整個(gè)收錄的減少,就是這個(gè)原因。頁(yè)面不怎么收錄,百度對(duì)網(wǎng)站的信任度下降,最終,快照也會(huì)停滯一段時(shí)間。
排名并未有所波動(dòng),流量正常
當(dāng)出現(xiàn)收錄減少,快照停滯的時(shí)候,我們最關(guān)心的問(wèn)題就是排名的問(wèn)題,擔(dān)心排名會(huì)有所影響。這點(diǎn)到是可以放心,因?yàn)槲恼卤徊杉瑢?dǎo)致自己站受到百度的考核,這個(gè)只是影響了百度對(duì)網(wǎng)站的信任度,并不會(huì)導(dǎo)致網(wǎng)站權(quán)重的下降,所以網(wǎng)站的關(guān)鍵詞排名并不會(huì)受到影響。
改善之后,網(wǎng)站收錄依然存在異常
假設(shè)我們發(fā)現(xiàn)自己網(wǎng)站被采集之后,我們對(duì)網(wǎng)站進(jìn)行了一些改善,成功的避免了網(wǎng)站被采集,那么你的網(wǎng)站還會(huì)有一個(gè)適應(yīng)期,整個(gè)適應(yīng)期表現(xiàn)出來(lái)的癥狀為:網(wǎng)站漸漸的開(kāi)始收錄文章頁(yè),但是收錄的并不是即時(shí)更新的文章,有可能是前天的或者大前天更新的。這樣的癥狀大概會(huì)存在1周的時(shí)間,之后收錄會(huì)慢慢的趨于正常,快照也會(huì)慢慢的恢復(fù)。
這一系列的現(xiàn)象都是當(dāng)網(wǎng)站處于長(zhǎng)期被他人采集的情況下會(huì)出現(xiàn)的,所以當(dāng)你自己的網(wǎng)站存在這樣的一些現(xiàn)象的時(shí)候,你首先要找的原因就是自己每天更新的文章是不是正在被別人采集。如果你的網(wǎng)站確實(shí)是處于這樣的情況,肯定是要想辦法解決的,當(dāng)然別人要采集你的文章,你不可能強(qiáng)制性的說(shuō)不讓別人去采集,所以我們能做的就是在自己本身上做一些改動(dòng)。
1、提升頁(yè)面權(quán)重
提升頁(yè)面的權(quán)重是可以從根本上解決這個(gè)問(wèn)題的,我們都知道,像A5、Chinaz這樣的網(wǎng)站每天都會(huì)被別人采集,但是這完全沒(méi)有影響到A5、Chinaz網(wǎng)站的收錄,這就是因?yàn)樗麄兊臋?quán)重足夠的高,當(dāng)別人網(wǎng)站出現(xiàn)和他們一樣的文章的時(shí)候,蜘蛛會(huì)默認(rèn)的把他們的文章作為原創(chuàng)源。所以一定要提升文章頁(yè)面的權(quán)重,多做一些這個(gè)頁(yè)面的外鏈。
2、Rss合理利用
開(kāi)發(fā)一個(gè)這樣的功能也是有必要的,在網(wǎng)站文章有更新的時(shí)候,第一時(shí)間就讓搜索引擎知道,主動(dòng)出擊,這樣會(huì)很有助于收錄的。而且Rss也能有效增加網(wǎng)站的流量,可以說(shuō)是一舉兩得。
3、做一些細(xì)節(jié),限制機(jī)器的采集
被人工采集還沒(méi)什么,要是沒(méi)人用工具定時(shí)、大量的采集你網(wǎng)站的文章,這確實(shí)讓人很頭疼,所以我們應(yīng)該在頁(yè)面的細(xì)節(jié)上做一些處理,至少能夠防止機(jī)器的采集。比如頁(yè)面不要設(shè)計(jì)的太傳統(tǒng)、大眾化;Url的寫(xiě)法要多變一些,不要成為默認(rèn)疊加等設(shè)置。
4、被采集的時(shí)候,更新的文章多與自己網(wǎng)站有關(guān)
別人采集我們的文章,是因?yàn)樗麄円残枰覀兏碌膬?nèi)容,所以如果我們更新的都是與自己網(wǎng)站有關(guān)的信息,經(jīng)常會(huì)穿插我們網(wǎng)站的名稱,別人在采集的時(shí)候就會(huì)覺(jué)得我們的文章對(duì)他們并沒(méi)有太多的意義,這也是很不錯(cuò)的避免采集的方式。
文章經(jīng)常被采集,這肯定是會(huì)對(duì)我們產(chǎn)生影響的,所以我們要盡量的去避免,讓自己網(wǎng)站的內(nèi)容在互聯(lián)網(wǎng)當(dāng)中成為唯一性,提升百度對(duì)我們網(wǎng)站的信任度,讓我們的優(yōu)化工作更加順暢。
本文當(dāng)中提及的現(xiàn)象都是筆者網(wǎng)站碰到的真實(shí)情況。文章由http://www.aidai.com/愛(ài)戴網(wǎng)整理給出,轉(zhuǎn)載請(qǐng)附明來(lái)源鏈接。