不少SEO-er都應該了解搜索引擎工作原理繁多復雜,大致一般分為三大步奏:爬行和抓取,建立索引和排名。當然SEO-er優(yōu)化網站,目的在于提高關鍵詞排名,增加產品曝光率。為此SEO-er們更加看重排名這一環(huán)節(jié),筆者在此對搜索引擎工作原理之排名做個小小的經驗之談。
搜索引擎面對的用戶大部分是通過鍵入關鍵詞返回一個列表頁面,這個結構頁面是大量的搜索索引庫而建立起來的。當然這里這個頁面是指自然搜索結果。那么搜索引擎是如何完成排名這以環(huán)節(jié)的呢?我們無妨看看整體思維圖。

一、對提交的搜索請求分析
搜索用戶在搜索引擎上鍵入關鍵詞,提交搜索請求,一步一步找到匹配的網頁顯示出來。當我們鍵入關鍵詞提交(按下回車)給搜索引擎時,搜索引擎便會對這次搜索請求進行詳細分析。
1、中文分詞
中文分詞是各大搜索引擎中重要的環(huán)節(jié),中文分詞能夠更加明確掌握搜索請求的重點所在,時期更好地頁面展示給搜索用戶。
百度中文分詞常見的以下三種:
a、基于字符串匹配
在基于字符串匹配中正向最大匹配法、逆向最大匹配法、最少切分這三種又比較常見。
正向最大匹配法:利用關鍵詞查詢的時候,在百度排名第一位的是以標題和搜索的長尾詞相符合,說明在網站條件相當的情況下,先顯示標題匹配的網頁。
逆向最大匹配法:剛剛是正向最大匹配法相反的規(guī)則,即從右往左反向進行拆分和組合。
最少切分:最小切分就是將一個個詞組切分為最細化,甚者會一個字出現。
b、理解分詞方法
理解分詞方法:搜索引擎模擬人的思維,對其語句的理解進行分詞技術。通過對存儲的詞語和語句的整合,進行分詞理解。其基本思想就是在分詞的同時進行句法、語義分析,利用句法信息和語義信息來處理歧義現象。它通常包括三個部分:分詞子系統(tǒng)、句法語義子系統(tǒng)、總控部分。在總控部分的協(xié)調下,分詞子系統(tǒng)可以獲得有關詞、句子等的句法和語義信息來對分詞歧義進行判斷,即它模擬了人對句子的理解過程。
c、統(tǒng)計分詞方法
相鄰的字同時出現的次數越多,中文分詞就會可能把出現相鄰的字當成你一個詞。我們常常不是使用粗體,黑體這些嗎?原因還在于這對于搜索引擎理解同樣有利。
2、去掉停止詞
搜索用戶在鍵入關鍵詞時,或多或少會出現不少停止詞,像“的”“嗎”,這樣才能最大限度的顯示最相關,最能夠滿足用戶體驗的結果頁面。
3、處理符號
搜索引擎還是很看重標點符號的,因此我們SEO-er在編輯文章的時候,應當注意標點符號的合理使用,尤其是在文章標題上。
二、匹配搜索請求
當搜索引擎接收到搜索請求詳細分析之后,便會匹配URL(當然重點是標題和摘要片段),匹配的URL成千上萬個,怎樣才能有序顯示出來了,這就需要搜索引擎按URL的匹配程度排序。
三、對匹配網頁排名
為匹配的網頁排序,其實就是搜索引擎對匹配的網頁進行篩選,挑選的過程,然后按照一定的順序整理出結構的行為。當然搜索引擎都會給每個網頁一個值,即權重(SEO-er們自我定義),通過判斷該網頁對搜索引擎和用戶體驗的價值進行排序排名。提高排名的因素多種多樣,目前基本上是參考HITS算法,TrustRank信任指數算法、PR值等等。
筆者比較淺顯的談談個人的看法,不知道SEO-er有什么想法,不妨補充交流。對于網絡優(yōu)化人員來說,必須充分了解和掌握搜索引擎工作原理,但是不少SEO-er了解的太少,望大家同進步,同向前看。
文章由重慶SEO(http://www.seoread.org/post/rank-principle.html)編寫,轉載時請以鏈接形式注明來源。
推薦閱讀
一、什么是網頁標題 在瀏覽一個網頁時,通過瀏覽器頂端的藍色顯示條出現的信息就是網頁標題。 如下圖所示。網頁標題就是整個網頁的題目,是對其內容的高度概括和總結。網頁標題作為網友第一眼看到的網頁信息傳遞之所>>>詳細閱讀
本文標題:搜索引擎工作原理之排名大揭秘
地址:http://www.xglongwei.com/a/34/20120326/44329.html