搜索引擎的橫空出世,讓我們更容易使用互聯網,十年前的信息爆炸言論現在已經基本停息,這些都歸功於搜索引擎,因為信息再多,已經有搜索引擎幫我們分類整理,我們想要的時候隻要輸入相關的關鍵詞就能夠找到相應的信息,就不會再存在那種信息爆炸式的狀態,找一個信息會把一個人折磨的半死!可見搜索引擎的貢獻和作用是多麼的巨大!
我們平時找信息都是通過輸入數據來獲得,也就是我們常說的關鍵詞,搜索引擎對於輸入的關鍵詞是如何工作的,是直接通過這個詞來找,還是要把這些詞分開,進行相關的比對再從數據庫中找,然後再根據這次詞來進行排名,很多人對這個工作原理還不是很清楚,筆者因為在SEO優化行業工作多年,對於搜索引擎的分詞原理也有瞭一定的瞭解,下面就把我的理解寫下來跟大傢討論一下!
一:首先就是分詞,這是搜索引擎都要做的工作,因為我們在搜索框裡面輸入的詞有時候是短語,有時候就是一個完整的句子,很少是用詞組來直接搜索的,所以搜索引擎在正式工作之前要把輸入的短語或者句子進行切分,然後把這些字符串變成詞組的組合,不能夠再分割瞭,然後在通過預處理的數據庫進行查詢和比對,把符合這些詞的數據返回給用戶,這個分詞其實和頁面分詞差不瞭多少!
二:去掉停止詞,所謂停止詞都是一些沒有實際意義的詞,比如一些啊,哦等等語氣詞,這些詞往往會在搜索的時候被輸入搜索框裡面,此時搜索引擎在正式和數據庫比對的時候會把這些沒有意義的停止詞取消然後保證搜索的準確性!
三:如何處理指令,對於搜索引擎處理搜索命令式,會把很多默認的詞組變成一個短語來進行搜索,這樣能夠保持較高的準確性,比如你在搜索框裡面輸入xx減肥xx網站,此時實際上被執行的命令是減肥網站,而不是全部的xx減肥xx網站返回結果,但是往往會返回一些單獨的這些詞的內容,比如單獨的減肥內容等等!另外指令執行的時候還要粗粒各種高級的搜索命令,比如特定的標識符,如加減號等等!
四:對輸入詞的矯正,因為漢字很多都有諧音,有時候寫詞組還很容易出現錯別字,這時候搜索引擎往往也能夠返回正確的結果來,這就是因為搜索引擎在分詞的過程中,將一些錯別字給矯正過來瞭,而且在返回的結果頁面的上方還會出現糾正後的正確詞組出來!如圖:
五:分類區分對待,不同的詞語會不同的對待,這是搜索引擎的一個獨特功能,如果你搜索的一般的關鍵詞,那麼返回的結果就是一般的網頁,而如果你搜索的是新聞熱詞或者明星關鍵詞時往往返回的就是相關的新聞源,所以搜索引擎在這方面的智能是相當高的!
上面就是筆者對於搜索引擎對關鍵詞的工作原理從五個方面進行瞭簡單的介紹,雖然這個原理對於我們做網站沒有直接的關系,但是在網站的優化方面還是有很大幫助到,畢竟涉及到關鍵詞的分析和選擇,所以認識這個原理對於我們個人站長們來說也是非常必要的!來源:www.che2.com 二手車市場原創,轉載請說明!
沒有留言:
發佈留言