A-A+

百度蜘蛛(baiduzhizhu)爬网行为分析

2014年04月02日 建站教程 暂无评论 阅读 898 views 次

站长们怎样才能知道百度蜘蛛到访过您的网站了呢?大家知道只有蜘蛛来了,你的网站才有可能被收录,首先我们要知道它何时来过,另外还要会分析百度蜘蛛的行为。

第一,发现蜘蛛来访

可以通过网站统计日志中的信息去发现,http://www.baidu.com.baiduzhizhu的链接记录就代表它来过了。

第二,分析百度蜘蛛的行为

我们最常见的就是:220.181.108.*这一段了!这段IP注意负责抓取网站的更新,和增加网站的权重的作用。

其次就是:123.125.71*。这段IP注意负责一些权重比较低的网站文章抓取情况,和文章原创度的情况,一般会在48小时内抓取你的网页,但是也会在48小时内删除你的资料。这也是许多新手站长奇怪的是为什么我的网站收录不到很久就没有排名的原因。一定要请大家注意,这个IP出现在网站日记的话一定要小心!

最后一个,也是大家不愿意看到的一个IP:123.125.68*。这段IP我们一般叫做黑武士,他如果来到你的网站的话,你的网站基本就会被降权或者被K掉,情况好的只会抓取你一次,如果网站大量出现这样的百度蜘蛛的话,你的网站就准备被K掉吧,也说明了百度发现你做了很多不好的事情。这个IP事许多老站长都不愿意看到的IP。

百度蜘蛛的三大类的基本工作情况:

前面我们说道最常见的就是220.181.108.*。内容已经解释过了就不在解释了,主要的蜘蛛【220.181.108.86】它抓取的网页权重是最大的,如果说这个蜘蛛在你的网页上返回正常的话,说明你的网站问题不大,如何抓取的时候返回数据库有其他的数值的话,说明网站问题就很大了,一定要注意。

快照蜘蛛:顾名思义就是说专门给你网页拍照的蜘蛛。IP结尾的75的就是快照蜘蛛,它来到你网站越多越好,为什么?不解释了。

IP结尾的89的蜘蛛,我们称为高权重的蜘蛛,但是它的权重没有IP86结尾的高,但是权重也是非常不错的。

接下来就是:94,97,80,83,z这些蜘蛛都是高权重的蜘蛛,它们的权重是依此递减的。剩下来的就是普通的蜘蛛了,它们会抓取新的网站的内容,返回数据库的值有200的话,一般情况下,会在24到40小时至内会被放出的。如果现实304的话,就说明此网站有待考察。

123.125.71*

这段IP有两个功能!

一,检查更新情况,一般这种情况的蜘蛛权重都比较低,它们一般只会检查网站的首页的更新情况。

二,文章的原创度的多少,此原理来自半发现象,怎么说呢,一般情况下被一个低权重的百度蜘蛛抓取过的网页的,它会再在抓取网页,如果发现相同的地方,会在48小时内删除的,并且还会降权的。

很多朋友都真正地很少的知道百度蜘蛛的工作原理是怎么回事的,通过菜菜的这篇文章,相信大家会对百度蜘蛛有个全新的认识,并不是说百度蜘蛛到你的网站上就是好事,这一定要注意!!!!

标签:

给我留言