分為四種:全文搜索引擎、元搜索引擎、垂直搜索引擎和目錄搜索引擎。特點(diǎn)如下:
1、全文搜索引擎
這種搜索方式方便、簡(jiǎn)捷,并容易獲得所有相關(guān)信息;利用爬蟲(chóng)程序抓取互聯(lián)網(wǎng)上所有相關(guān)文章予以索引;但搜索到的信息過(guò)于龐雜,因此用戶需要逐一瀏覽并甄別出所需信息。
2、元搜索引擎
基于多個(gè)搜索引擎結(jié)果并對(duì)之整合處理的二次搜索方式;元搜索引擎適用于廣泛、準(zhǔn)確地收集信息;有利于各基本搜索引擎間的優(yōu)勢(shì)互補(bǔ);有利于對(duì)基本搜索方式進(jìn)行全局控制,引導(dǎo)全文搜索引擎的持續(xù)改善。
3、垂直搜索引擎
對(duì)某一特定行業(yè)內(nèi)數(shù)據(jù)進(jìn)行快速檢索的一種專業(yè)搜索方式;適用于有明確搜索意圖情況下進(jìn)行檢索,以準(zhǔn)確、迅速獲得相關(guān)信息。
4、目錄搜索引擎
依賴人工收集處理數(shù)據(jù)并置于分類目錄鏈接下的搜索方式;對(duì)網(wǎng)站內(nèi)信息整合處理并分目錄呈現(xiàn)給用戶;目錄搜索方式的適應(yīng)范圍非常有限,且需要較高的人工成本來(lái)支持維護(hù)。
擴(kuò)展資料:
搜索引擎的關(guān)鍵技術(shù)
1、網(wǎng)絡(luò)爬蟲(chóng),根據(jù)相應(yīng)的規(guī)則,以某些站點(diǎn)作為起始站點(diǎn)通過(guò)各頁(yè)面上的超鏈接遍歷整個(gè)互聯(lián)網(wǎng),利用URL弓I用根據(jù)廣度優(yōu)先遍歷策略從一個(gè)html文檔爬行到另一個(gè)html文檔來(lái)抓取信息。
2、中文分詞,在創(chuàng)建索引之前需要將中文內(nèi)容合理的進(jìn)行分詞。中文分詞是文本挖掘基礎(chǔ),對(duì)于輸入的一段中文,成功的進(jìn)行中文分詞,可以達(dá)到電腦自動(dòng)識(shí)別語(yǔ)句含義的效果。
3、大數(shù)據(jù)處理技術(shù),通過(guò)運(yùn)用大數(shù)據(jù)處理計(jì)算框架,對(duì)數(shù)據(jù)進(jìn)行分布式計(jì)算。由于互聯(lián)網(wǎng)數(shù)據(jù)量相當(dāng)龐大,需要利用大數(shù)據(jù)處理技術(shù)來(lái)提高數(shù)據(jù)處理的效率。在搜索引擎中,大數(shù)據(jù)處理技術(shù)主要用來(lái)執(zhí)行對(duì)網(wǎng)頁(yè)重要度進(jìn)行打分等數(shù)據(jù)計(jì)算。
*請(qǐng)認(rèn)真填寫需求信息,我們會(huì)在24小時(shí)內(nèi)與您取得聯(lián)系。