基于相关度和流行度的改进HITS算法
HITS算法是基于查询主题的重要的链接分析方法之一,但它对链接不加区分,容易产生主题漂移现象。
本文在分析HITS算法的基础上,提出了基于主题相关度和网页流行度的改进HITS算法,利用相关度和流行度来区分链接的重要性。通过与HITS算法的对比实验,结果表明:改进的HITS算法(I-HITS)比原始的HITS算法、ARC算法、SALSA算法能找到更多的相关网页,相关度比例提高30%-50%,从而极大地减少了主题漂移现象,提高了查询效率和质量。
版权所有:中国教育和科研计算机网网络中心 Copyright © 1994-2017 CERNIC,CERNET,京ICP备05078770号,京网文[2014]2106-306号
关于假冒中国教育网的声明 | 有任何问题与建议请联络:Webmaster@cernet.com