微信扫一扫微信扫一扫| 官方微博官方微博|
分享到:
现在的位置:首页 > SEO百科 > SEO必学 > 蜘蛛是如何爬取内容的

蜘蛛是如何爬取内容的

蜘蛛先去抓取百度白名单的网站或者一些信任度非常高的站点和页面(例如:一些高权重网站和网站的首页),在抓取这些网页的内容时发现一些指向另外一些一些页面的链接。蜘蛛会把这些链接保存在自己的数据库里面,然后再根据抓取顺序依次来抓取这些网页。

 

1、蜘蛛抓取网页的规则:

 

对于蜘蛛说网页权重越高、信用度越高抓取越频繁,例如网站的首页和内页。蜘蛛先抓取网站的首页,因为首页权重更高,并且大部分的链接都是指向首页。然后通过首页抓取网站的内页,并不是所有内页蜘蛛都会去抓取。

 

搜索引擎认为对于一般的中小型站点,3层足够承受所有的内容了,所以蜘蛛经常抓取的内容是前三层,而超过三层的内容蜘蛛认为那些内容并不重要,所以不经常爬取。

 

2、如何看蜘蛛的抓取?

 

通过iis日志可以看蜘蛛爬取了哪些内容,iis日志有百度蜘蛛、谷歌蜘蛛等。从iis日志里卖弄分析得出蜘蛛的类型、抓取时间、抓取的页面、抓取内容的大小以及返回的页面代码,200代表抓取顺利。

 

详细了解IIS分析请点击:IIS日志分析方法

  《优度课堂》是湖南优度网络科技有限公司旗下设立的一个实战经验丰富、落地式的网络营销培训机构,公司创始人谭艳,从事互联网营销12年,是一位实力派的网络营销专家、也是一位资深的微营销导师,累计为上千家企事业单位通过网络营销获得了巨大的收益,也帮助很多微商个人及团队成功转型!

  互联网时代你必须要懂得网络营销赚钱模式,参加优度课堂网络营销培训带你走进互联网的成功之道。咨询热线:0731-55587844

上一条:iis日志分析方法       下一条:如何写原创文章
SEO培训
18973218026
加微信254596208
微商培训
0731-55587844
微商培训

学员案例

关于我们

Copyright @ 2015 湖南优度网络科技有限公司版权所有 保留一切权利 备案号:湘ICP备16004006号-6 网站地图 技术支持:优度网络 犀牛·云链