输入复制码,即可复制
关注 公众号 发送 复制码 即可获取
只需要3秒时间
查看: 94|回复: 0

浅谈搜索引擎收录的三大原理

[复制链接]

36

主题

36

帖子

72

积分

新手

Rank: 2

积分
72
发表于 2014-12-29 11:30 | 显示全部楼层 |阅读模式
搜索引擎的工作就是在网络上进行数据采集,这也是搜索引擎最基础的工作,其中搜索引擎的内容是来自URL列表中,我们可以通过这些列表不断的收录,储存以及维护,学习搜索引擎的收录流程、原理、收录方式是可以帮助我们提高搜索引擎对网站的收录数量。
第一点:收录流程
在网站中URL是页面的入口地址,蜘蛛程序是通过这些来抓取页面的。蜘蛛不断的从页面中获取资源及存储页面,然后加入到URL列表中,然后再不断的循环,搜索引擎就能在网络中获取很多页面。
URL被称为页面的入口,而域名被称为网站的入口,当搜索引擎进入网站抓取网站中的页面时,首先就是要加入搜索引擎的域名列表中,我们常见的搜索引擎列有两种方式,第一种是搜索引擎给我们提供登录信息,然后向搜索引擎提交网站域名,用这种方法只能定期抓取且比较被动,花费的时间也比较长。第二种是通过高质量的链接让搜索引擎在抓取别人网站的同时看到我们,从而实现对网站的收录,使用这种方法的主动权在我们这边,且速度会比较快一些,如果链接的数量质量比较好,一般在一周内会被搜索引擎收录。
第二点:收录原理
如果我们把网站的页面看成是一个有向图,我们从指定的页面出发,按照某种特定的策略对网站中的页面进行编辑,然后不断的从URL列表中拿出访问的URL,在存储页面同时提取信息,URL可以分为两类一是域名,二是内部URL,如果是判断URL是否被访问过,把URL加入URL列表中就知道了,经过这些工作,搜索引擎可以建立列表、页面URL以及储存页面。
第三点:收录方式
页面收录方式是指搜索引擎抓取页面时所使用的策略,其目的就是为了能在网络中选出较重要的信息,页面收录方式的制定取决于搜索引擎对网络结构的理解,如果是使用相同的抓取策略,搜索引擎在同样的时间会抓取更多的资源,在网站停留的时间更长,被收录的页面也就会越多。
更多内容:http://m.yingwe23.com
温馨提示:
1、本内容转载于网络,版权归原作者所有!
2、本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
3、本内容若侵犯到你的版权利益,请联系我们,会尽快给予删除处理!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

客服QQ/微信
860820528 周一至周日:09:00 - 22:00
十五年老品牌,学习网上创业赚钱,首先阿抖学社,值得信赖!
阿抖学社 版权所有!

本站内容均转载于互联网,并不代表阿抖学社立场!
拒绝任何人以任何形式在本站发表与中华人民共和国法律相抵触的言论!

小黑屋|广告服务|加入vip|APP下载|手机版| 阿抖学社 ( 蜀ICP备14032121号-4 ) |网站地图

GMT+8, 2025-9-30 22:15 , Processed in 0.078871 second(s), 31 queries .

快速回复 返回顶部 返回列表