一、什么是搜索引擎的架構?
搜索引擎架構可以當作軟件架構來理解。
① 軟件架構
百度百科對于軟件架構的描述如下:
軟件架構,是指一系列相關的抽象模式,用于指導大型軟件系統(tǒng)各個方面的設計。
② 搜索引擎架構
那么搜索引擎的架構,就是用于指導搜索引擎系統(tǒng)中重要的組件以及組件之間關系而設計的抽象模式。
二、設計搜索引擎架構的目標是什么?
SEOer應該知道為什么要設計搜索引擎架構,主要有以下兩點:
① 搜索效果
搜索引擎致力于優(yōu)化用戶搜索體驗,當用戶搜索某個詞之后,可以給予用戶更多更精準的結果。這就是在質量層面上的目標。
② 搜索效率
搜索引擎追求更快地展現(xiàn)出用戶查詢詞的搜索結果,也是為了提升用戶搜索體驗,試想如果我們搜索一個詞,搜索引擎一分鐘后才顯示出結果,這樣的搜索引擎在這個時代是要被淘汰的。這就是在速度層面上的目標。
小結:因為用戶需要一個高效的搜索引擎系統(tǒng),對搜索引擎有效果和效率的要求,所以,結構的目標也就是這兩點了。
三、搜索引擎的基本架構是什么?
對于SEOer而言,只需要在抽象模式上了解搜索引擎架構即可,也無需關注過多的數(shù)學公式與算法。
搜索引擎基本架構主要有索引處理和查詢處理。
① 索引處理
搜索引擎的基本架構-小小課堂SEO培訓教程
索引過程主要由以下幾個組件來完成:
1)文本采集組件
文本采集組件,主要用于發(fā)現(xiàn)、存儲和傳遞文檔。
2)文本轉換組件
文本轉換組件,主要用于提取文檔中所有內容和元數(shù)據(jù),同時將文本轉換為索引項。
元數(shù)據(jù)可以理解為頁面的基本參數(shù),如類型、結構、多少字等等。
索引項,又可以稱之為特征,是對文檔內容的一部分,符合要求的文檔的索引會被存放在索引表中用于搜索。
3)索引創(chuàng)建組件
索引創(chuàng)建組件,利用文本轉換組件輸出的文檔和索引項,創(chuàng)建索引表,從而實現(xiàn)快速搜索。
索引的創(chuàng)建非常重要,尤其是針對互聯(lián)網的信息爆炸時代,對于新的文檔加入時,應高效完成索引創(chuàng)建。為了實現(xiàn)高效,一般都采用的倒排索引。
② 查詢處理
查詢處理主要由以下幾個組件來完成:
1)用戶交互組件
用戶交互組件,提供了用戶查詢和搜索引擎展現(xiàn)搜索結果之間的接口。
搜索引擎接收到用戶的查詢詞后,在索引庫中找到相關文檔,按照程序認為的最合理的索引排序結果展現(xiàn)給用戶。
2)排序組件
排序組件,從用戶交互組件中獲得查詢詞,并且根據(jù)一定的模型給出一個得分從高到低排序的文檔。
排序的高效依賴于搜索引擎檢索技術的高低,排序的質量取決于搜索引擎的檢索模式。
3)評價組件
評價組件,主要用于評測和評價搜索引擎系統(tǒng)的效果和效率的目標。
一來可以統(tǒng)計大量搜索日志來記錄和分析用戶行為,二來評價的結果用來調整和改善排序組件的性能,從而提升用戶的搜索體驗度。
文章由:佛山網站設計整理提供,此文觀點不代表本站觀點
微信公眾號搜索
"佛山華企立方"