|
分析链接是常见的搜索引擎分析网页结构的一种方式,一般是搜索引擎根据相关的链接分析算法,然后对与网页相关的外链和内链进行详细的数据整理和分析,并且根据这些链接的特点,再对网页进行一个评分和排序,当就用户搜索某个关键词的时候,搜索引擎就会对与该关键词相关主题的网页中的这些链接进行一个合理分析,然后排序,最后就得到了排名的结构,在
HITS算法在应用中,一般都是利用HUB页(网页中很多链接,并且都是指向权威的页面,一般都是导航或者目录网页)和Authority(就是被大量链接指向的网页,也就是权威型的网页)页面之间指向链接的互相加强关系来对网页给予分值计算,也就是说该算法的实施过程中是将搜索引擎从互联网上抓去到全部网页分为HUB页面和Authority页面,在搜索引擎看来,好的Hub网页应该是指向很多的权威型的网页,而权威值高的网页应该是拥有很多指向Hub网页的链接,所以我们由此而得出了HITS算法的核心思想:
首先,我们知道HITS算法是基于主题查询的搜索引擎算法,所以当用户向搜索引擎提交主题查询时,搜索引擎根据用户的检索词进行关键词匹配查询,同时返回若干项与主题高度相关的网页集合S,在这些相关性的网页集合中,网页之间会有大量和网页相关的链接,所以此时搜索引擎算法HITS算法就根据网页上链接的特点将网页集合S进行拓展,即将集合网页上的链接,网页引用的链接,和被其他页面的引用的链接都加入到该集合中,形成一个新的集合T,同时我们对集合T的要求是:
1、 T中都是和集合中网页相关的页面
2、 T中的集合页面都要于主题高度相关
3、 T中要包含大量的HUB页面和Authority页面
在了解了HITS算法的核心思想之后,我们需要了解的就是如何根据该算法所给出的思想进行计算网页集合中的网页的权重来对搜索结果进行排序,那么下面笔者通过转载必须保留链接!
上海到哈尔滨物流:http://www.lyhaerbin56.com
|
温馨提示:
1、本内容转载于网络,版权归原作者所有!
2、本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
3、本内容若侵犯到你的版权利益,请联系我们,会尽快给予删除处理!
|