認識搜索引擎的工作原理

  • 作者: admin
  • 發布日期: 2013-08-01 18:42:16
  • 點擊:

搜索引擎的主要工作包括:頁面收錄、頁面分析、頁面排序及關鍵詞查詢。

一 頁面收錄
  頁面收錄指搜索引擎通過蜘蛛程序在互聯網上面抓取頁面進行儲存的過程,它為搜索引擎開展各項工作提供數據支持。
  這里所說的蜘蛛即為搜索引擎的漫游程序(Spider系統程序),也叫搜索機器人或者網絡蜘蛛;之所以叫它機器人,是因為Spider程序是一個非常智能的,具有分析、判斷能力,如可以判斷出網頁是否進行了優化作弊,給網頁評級等。

  搜索機器人通過網絡上的各種鏈接和IP地址遍歷互聯網上的WEB空間,并沿著網絡上的鏈接從一個網頁到另一個網頁,從一個網站到另一個網站采集網頁資料;它為保證采集的資料最新,還會回訪已抓取過的網頁。

二 頁面分析
    由分析索引系統程序對網絡蜘蛛采集回來的網頁進行分析,提取相關網頁信息(包括網頁所在URL、編碼類型、頁面內容包含的關鍵詞、關鍵詞位置、生成時間、大小、與其它網頁的鏈接關系等),根據一定的相關度算法進行大量復雜計算,得到每一個網頁針對頁面內容中及超鏈中每一個關鍵詞的相關度(或重要性),然后用這些相關信息建立網頁索引數據庫。 我們平時看到的搜索引擎,實際上只是一個搜索引擎系統的檢索界面,當你輸入關鍵詞進行查詢時,搜索引擎會從龐大的數據庫中找到符合該關鍵詞的所有相關網頁的索引,并按一定的排名規則呈現給我們。不同的搜索引擎,網頁索引數據庫不同,排名規則也不盡相同,所以,當我們以同一關鍵詞用不同的搜索引擎查詢時,搜索結果也就不盡相同。
 

三 頁面排序
    當用戶輸入關鍵詞搜索后,搜索引擎結合頁面的內外部因素計算出頁面與某個關鍵詞的相關度,從而得到與該關鍵詞相關的頁面排序列表。由搜索系統程序從網頁索引數據庫中找到符合該關鍵詞的所有相關網頁。因為所有相關網頁針對該關鍵詞的相關度早已算好,所以只需按照現成的相關度數值排序,相關度越高,排名越靠前。

四 關鍵詞查詢
    搜索引擎接受來自用戶的查詢請求,并對查詢信息進行切詞及匹配后,再想用戶返回相應的頁面排序列表。這就是我們平時看到的搜索引擎界面。如Google.com、baidu.com等。


 

網站備案所需要提供的資料清單

目前,國內每個網站都必須具有信息產業部批準的備案號才能正常開通,否則只有選擇國外的服務器。
欧美性XXXX极品高清HD,永久免费A片在线观看全网站,免费观看成人A片免费不卡在线,美女黄18以下禁止观看免费的