输入复制码,即可复制
关注 公众号 发送 复制码 即可获取
只需要3秒时间
查看: 88|回复: 0

“如出一辙”蜘蛛爬行过程“有迹可循”

[复制链接]

238

主题

232

帖子

466

积分

小生

Rank: 3Rank: 3

积分
466
发表于 2014-4-4 14:35 | 显示全部楼层 |阅读模式
“如出一辙”蜘蛛爬行过程“有迹可循”
1、搜索引擎程序是通过网页之间的链接,不分昼夜的爬行来获取信息,收录标准主要由URL的权重、网站规模大小等因素决定;
2、搜索引擎进入服务器时,第一时间查看robots.txt(控制搜索引擎收录的标准)文件,如果robots.txt文件不存在,则返回404错误代码,但依然会继续爬行,如果定义了某些规则,则遵守索引。
3、建议必须有一个robot .txt文件(推荐阅读:robots.txt的写法。
搜索引擎抓取数据的方式
1、垂直抓取策略:指搜索引擎顺着一条链接爬行,直到设定的任务完成。
思路如下:垂直抓取策略—A链接—A网页链接—A网页链接的链接 ,一直垂直抓取到最底。
2、平行抓取策略:指先把网页mszfty.com山的链接全部抓取一次,然后接着从每条链接牌型。
总结:在实际应用中,这两种策略会同时发生,抓取的深度和广度取决于页面的权重、结构和网站规模大小以及新鲜内容数量和频率,当然这里面包含了很多的seo的策略。本文由头手对抗http://www.dr-zhang.cn/smsf.php整理,转载以链接形式注明。
温馨提示:
1、本内容转载于网络,版权归原作者所有!
2、本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
3、本内容若侵犯到你的版权利益,请联系我们,会尽快给予删除处理!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

客服QQ/微信
860820528 周一至周日:09:00 - 22:00
十五年老品牌,学习网上创业赚钱,首先阿抖学社,值得信赖!
阿抖学社 版权所有!

本站内容均转载于互联网,并不代表阿抖学社立场!
拒绝任何人以任何形式在本站发表与中华人民共和国法律相抵触的言论!

小黑屋|广告服务|加入vip|APP下载|手机版| 阿抖学社 ( 蜀ICP备14032121号-4 ) |网站地图

GMT+8, 2025-6-30 15:48 , Processed in 0.056406 second(s), 27 queries .

快速回复 返回顶部 返回列表