Hilltop算法是由Krishna Baharat在200(!年左右所研究的,于2001年申請了專利,并 且把專利授權給Google使用,后來Krishna Baharat本人也加入了Google. Hilltop算法可以簡單理解為與主題相關的PR值.傳統PR值與特定關鍵詞或主題沒 有關聯,只計算鏈接關系。這就有可能出現某種漏洞。比如一個PR值極高的關于環保內 容的大學頁面,上面有一個鏈接連向一個兒童用品網站。這個鏈接出現的原因可能僅僅是 因為這個大學頁面維護人是個教授.他太太在那個賣兒童用品的公司工作.這種與主脫無 關、卻有著極高PR值的鏈接,有可能使一些網站獲得很好的排名,但其實相關性并不高。 Hilltop算法就嘗試矯正這種可能出現的疏漏.Hilltop算法同樣是計算鏈接關系,不過Hilltop算法是由Krishna Baharat在200(!年左右所研究的,于2001年申請了專利,并 且把專利授權給Google使用,后來Krishna Baharat本人也加入了Google. Hilltop算法可以簡單理解為與主題相關的PR值.傳統PR值與特定關鍵詞或主題沒 有關聯,只計算鏈接關系。這就有可能出現某種漏洞。比如一個PR值極高的關于環保內 容的大學頁面,上面有一個鏈接連向一個兒童用品網站。這個鏈接出現的原因可能僅僅是 因為這個大學頁面維護人是個教授.他太太在那個賣兒童用品的公司工作.這種與主脫無 關、卻有著極高PR值的鏈接,有可能使一些網站獲得很好的排名,但其實相關性并不高。 Hilltop算法就嘗試矯正這種可能出現的疏漏.Hilltop算法同樣是計算鏈接關系,不過 它更關注來自主題相關頁面的鏈接權重。在Hilltop算法中把這種主題相關頁面稱為專家文 件。顯然.針對不同主鹿或搜索詞有不同的專家文件。 根據Hilltop算法.用戶搜索關鍵詞后.Google先按正常排名算法找到一系列相關頁 面并排名,然后計算這些頁面有多少來自專家文件的、與主壓相關的鏈接.來自專家文件 的鏈接越多,頁面的排名分值越高.按Hilltop算法的初構想.一個頁面至少要有兩個來 自專家文件的鏈接,才能返回一定的Hilltop值,不然返回的Hilltop值將為零. 根據專家文件鏈接計算的分值被稱為LocalRank.排名程序根據LocalRank值,對原 本傳統排名算法計算的排名做重新調整,給出后排名。這就是前面討論的搜索引擎排名 階段后的過濾和調整步驟. Hilltop算法初寫論文和申請專利時對專家文件的選擇有不同描述。在初的研究 中.Krishna Baharat把專家文件定義為包含特定主甩內容,并且有比較多導出鏈接到第三 方網站的頁面.這有點類似于HITS算法中的樞紐頁面。專家文件鏈接指向的頁面與專家 文件本身應該沒有關聯.這種關聯指的是來自同一個主域名下的子域名,來自相同或相似 IP地址的頁面等。常見的專家文件經常來自于學校、政府及行業組織網站. 在初的Hilltop算法中,專家文件是預先挑選的.搜索引攀可以根據常見的搜索詞. 預先計算出一套專家文件,用戶搜索時.排名算法從事先計算的專家文件集合中選出與搜 索詞相關的專家文件子集.再從這個子集中的鏈接計算LocalRank值. 不過在2001年所申請的專利中.Krishna Baharat描述了另外一個挑選專家文件的方 法。專家文件并不預先選擇。用戶搜索特定查詢詞后.搜索引攀按傳統算法挑出一系列初 始相關頁面,這些頁面就是專家文件.Hilltop算法在這個頁面集合中再次計算哪些網頁有 來自于集合中其他頁面的鏈接,賦予比較高的LocalRank值。由于傳統算法得到的頁面集 合已經具備了相關性。這些頁面再提供鏈接給某一個特定頁面。這些鏈接的權重自然應該 很高。這種挑選專家文件的方法是實時進行的。 通常認為Hilltop算法對2003年底的佛羅里達更新有重大影響。不過Hilltop算法是否 真的已經被融入進Googl。排名算法中,沒有人能夠確定。Googic從來沒有承認、也沒有 否認自己的排名算法中是否使用了某項專利.不過從排名結果觀察及招攬Krishna Baharat 至魔下等跡象看,Hilltop算法的思想得到了Googl。的極大重視。