输入复制码,即可复制
关注 公众号 发送 复制码 即可获取
只需要3秒时间
查看: 122|回复: 0

HITS——基于页面属性的链接算法

[复制链接]

170

主题

170

帖子

340

积分

小生

Rank: 3Rank: 3

积分
340
发表于 2013-9-29 18:47 | 显示全部楼层 |阅读模式
            看过这篇文章后,你也许可以清楚以下两件事儿:

            1、一个单页面网站,为啥页面上都是出链,被指向的链接也很少,不过却有美好的名次;

            2、网站页面上是不是没有出链(指向外部的)才是最好的?

            看完上面所说的,有兴致没?好吧,无论你有木有兴致,哥要接着了。

            在一点电视剧上,也许大家会常常看见这么的场景,男猪脚A为了理解还是意识某私人,某件事儿,往往会去当地的旅馆饭馆向店小二询问、还是直接找到当地的地头蛇去理解事情状况。

            无它,只是由于它们就像是一个当地各种事物各种人的活向导、活地图,它们有可能对这些个事物的从头到尾理解的不够纤悉,不过定然晓得和这件事儿有牵扯的人还是物。

            所说的调查事物的从头到尾,一张关系+事情网罢了。

            这种事物放到搜索引擎网站算法上,理所应该的一样设立,只然而角色道具所有发生了改换:男猪脚A成为了广大的搜索引擎网站用户,关系与事情网成为了链接组成的各种关系,而店小二与地头蛇成为了我们今日看见的各种让人倍感迷惑的站点。

            将这些个结合起来的,就是HITS算法。

            先来看看百度各种学科的诠释。

            HITS算法:一个网页关紧性的剖析的算法,依据一个网页的入度(指向此网页的超链接)和出度(从这个时候起网页指向别的网页)来权衡网页的关紧性。其最直观的意义是假如一个网页的关紧性颀长,则他所指向的网页的关紧性也高。一个关紧的网页被另一个网页所指,则表明指向它的网页关紧性也会高。指向别的网页定义为Hub值,被指向定义为Authority值。

            

         

  

         

            假如你木有看懂,木得关系,哥来接着给你说一下子。 对于不论什么一个页面来说,其本身定然有两种属性:目次属性(还有人喜欢叫做中心环节)+权威属性。

            目次属性即他本身会有出链,也会更像一个导航,奉告读者想看见关于某件事儿更周密的信息可以点链接出去检查;权威属性即每个页面都是基于某个正题所论述的,这个页面也定然会有基于该正题的权威值,体积罢了。

            

         

  

         

            理解了这个,着手接着看下它是怎么使用到搜索引擎网站算法中去的。

            在面前绍介搜索引擎网站原理的文章(www.SEOsos.cn/seo-tips/search-engine-principle.html)中,我们绍介过搜索引擎网站是怎么处置页面并回返最后结果的,HITS算法正是在此基础之上开展起来的。下边来看周密的步骤。

            1、查寻根聚齐

            将查问q提交处理给基于关键字查问的检索系统,从回返最后结果页面的聚齐中取前n个网页(如n=200),作为根聚齐(root set),记为S,则S满意:

            1.1、S中的网页数目较少;

            1.2、S中的网页是与查问q有关的网页;

            1.3、S中的网页里面含有较多的权威(Authority)网页。

            2、拓展有关页面

            有了一点牛逼的权威页面,着手拓展有关页面。

            其维度也只有两种:指向权威页面的和权威页面指向的。

            要清楚为何这样拓展页面,需求先了解一句话: 一个权威页被多个目次页指向,解释明白这个权威页很权威;一个目次页指向了多个权威页,解释明白这个目次页很目次。

            先诠释一下子:哥不是纯心跟您玩急口令,自个儿先了解一下子。

            3、计算页面的权威值和目次值

            有了一个有关的子集,也了解了上面所说的的意思,着手计算各个页面的目次值和权威值。 计算公式很简单: 先来给个起初子集的聚齐P={p1,p2,p3hellip;pn,而后依据这些个页面之间的链接关系树立起一个矩阵:

         

  

         

            假如页面1有链接指向页面2,则a12的值即为1,与之相反,则为0。

            a页面的权威值即为指向它的全部目次页面的目次值之和;

            a页面的目次值则为它指向的占有权威页面的权威值之和。

            4、回返最后结果

            依照页面的目次值和权威值回返最后结果。

            好了,伶俐的同志应当也可以看见,这个算法是基于某一正题的,可以美好的反响出了人际关系中的一点独特的地方,也能美好的反响出了互联网关系的一点独特的地方。

            它也会有一点比较恶心的不充足之处,譬如耗时(在回返最后结果在这以后再计算,会增加用户等待的时间),会发生正题漂移(不思索问题内部实质意义,只思索问题链接会导致压根儿在说A事物,有可能最后结果成为了有一小批在说B事物)等等。

            当然,从其中我们可以看见一个事情的真实情况,那就是实际上搜索引擎网站的算法并木有传闻中的那末高深莫测的,众多也是基于人际关系为原形计算出来的(面前的PR算法(www.seosos.cn/search-engine/pr.html)也同样),由于毕竟,搜索引擎网站算法工程师也是人,对比来说,它们的优势在于怎么经过一系列的算法将这一原理成为机器可以读懂的事实。

            

            过载请注明链接地址:http://www.wenjuntech.com/SEM/blog-1678.html

  本文由 www.buyiphone5online.com 提供 转载请注明

}
温馨提示:
1、本内容转载于网络,版权归原作者所有!
2、本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
3、本内容若侵犯到你的版权利益,请联系我们,会尽快给予删除处理!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

客服QQ/微信
860820528 周一至周日:09:00 - 22:00
十五年老品牌,学习网上创业赚钱,首先阿抖学社,值得信赖!
阿抖学社 版权所有!

本站内容均转载于互联网,并不代表阿抖学社立场!
拒绝任何人以任何形式在本站发表与中华人民共和国法律相抵触的言论!

小黑屋|广告服务|加入vip|APP下载|手机版| 阿抖学社 ( 蜀ICP备14032121号-4 ) |网站地图

GMT+8, 2025-6-25 21:00 , Processed in 0.078252 second(s), 33 queries .

快速回复 返回顶部 返回列表