php判断百度蜘蛛IP是否是真百度IP

众所周知,百度蜘蛛爬虫对于网站SEO有很好的索引和帮助,能够快速在百度首页通过关键词搜索直达您的网站。

经常听到站长们问,百度蜘蛛是什么?最近百度蜘蛛来的太频繁服务器抓爆了,最近百度蜘蛛都不来了怎么办,还有很多站点想得到百度蜘蛛的IP段,想把IP加入白名单,但IP不固定,我们无法对外公布。

那怎么才能识别正确的百度蜘蛛呢?

1来来来,教你php判断百度蜘蛛IP是否是真百度IP

function isBaidu($ip) {
	if (!$ip) {
		return false;
	}
	$ipArray = [
			'14.215.177','27.221.36','27.221.37','27.221.38','27.221.39','27.221.40','36.110.198','36.248.6','42.81.93','42.236.4','42.236.7','58.20.204','58.215.118','58.215.123','58.216.2','58.217.200','58.217.202','59.38.112','59.51.81','59.53.69','60.28.22','61.54.47','61.135','61.155.149','61.155.165','61.182.137','61.233.141','63.243.252','101.69.162','101.71.56','103.235.44','103.235.45','103.235.46','103.235.47','104.193.88','104.193.89','106.12','106.13','106.120.159','111.1.52','111.7.168','111.12.25','111.13.100','111.13.113','111.20.242','111.32.132','111.47.212','111.62.0','111.177.3','111.202.114','111.206','112.25.86','112.65.203','112.80.248','112.80.252','112.80.255','112.84.34','112.253.12','113.105.148','113.113.73','113.215.19','115.231.42','115.239.210','115.239.211','115.239.212','116.31.127','116.211.117','117.27.148','117.27.149','117.27.232','117.34.28','117.34.37','117.34.112','117.157.16','117.161.5','117.169.99','117.174.144','118.123.116','118.123.210','118.192.48','119.63.192','119.63.193','119.63.194','119.63.195','119.63.196','119.63.197','119.63.198','119.63.199','119.75','119.146.74','119.147.134','119.167.246','120.52.29','120.52.114','120.204.206','120.241.70','121.32.89','121.32.89','122.193.41','122.228.234','123.125','123.138.46','124.95.170','124.192.164','124.193.227','124.238.238','125.39.78','125.39.79','150.138.138','150.242.123','153.3.236','157.255.71','159.226.50','162.105.207','163.177.8','163.177.151','180.76','180.97.33','180.97.34','180.97.35','180.97.36','180.97.104','180.149.131','180.149.132','180.149.133','180.149.144','180.149.145','182.61','182.118.47','182.150.1','183.60.131','183.131.34','183.230.68','185.10.104','185.10.105','185.10.106','185.10.107','202.46.48','202.46.49','202.46.50','202.46.51','202.46.52','202.46.53','202.46.54','202.46.55','202.46.56','202.46.57','202.46.58','202.46.59','202.46.60','202.46.61','202.46.62','202.108.22','202.108.23','202.108.249','202.108.250','211.90.25','211.97.81','211.144.71','218.17.55','220.113.150','220.181','221.180.244','221.195.34','221.204.160','222.35.78','222.199.144','222.199.188','222.199.189','222.199.190','222.199.191','222.216.190','222.216.229','223.95.34','223.99.240',
		];
	$status = false;
	foreach ($ipArray as $key => $value) {
		if (strpos($ip,$value) !== false) {
			$status = true;
			break;
		}
	}
	return $status;
}

1附录百度蜘蛛IP地址

123.125.68.*这个蜘蛛经常来,别的来的少,表示网站可能要进入沙盒了,或被者降权。

220.181.68.*每天这个IP段只增不减很有可能进沙盒或K站。

220.181.7.*、123.125.66.*代表百度蜘蛛IP造访,准备抓取你东西。

121.14.89.*这个ip段作为度过新站考察期。

203.208.60.*这个ip段出现在新站及站点有不正常现象后。

210.72.225.*这个ip段不间断巡逻各站。

125.90.88.*广东茂名市电信也属于百度蜘蛛IP主要造成成分,是新上线站较多,还有使用过站长工具,或SEO综合检测造成的。

220.181.108.95这个是百度抓取首页的专用IP,如是220.181.108段的话,基本来说你的网站会天天隔夜快照。(悲剧的我竟然屏蔽了这个IP)

220.181.108.92同上98%抓取首页,可能还会抓取其他(不是指内页)220.181段属于权重IP段此段爬过的文章或首页基本24小时放出来。(嗯,还有这个也屏蔽了,晕死了!)

123.125.71.106抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创或采集文章。(这个也有,汗!)

220.181.108.91属于综合的,主要抓取首页和内页或其他,属于权重IP段,爬过的文章或首页基本24小时放出来。

220.181.108.75重点抓取更新文章的内页达到90%,8%抓取首页,2%其他。权重IP段,爬过的文章或首页基本24小时放出来。(这个,……!)

220.181.108.86专用抓取首页IP权重段,一般返回代码是30400代表未更新。(还有这个……)

123.125.71.95抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创或采集文章。

123.125.71.97抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创或采集文章。

220.181.108.89专用抓取首页IP权重段,一般返回代码是30400代表未更新。(好吧,220开头的好像都被我屏蔽了,下手真心有点儿太狠了!)

220.181.108.94专用抓取首页IP权重段,一般返回代码是30400代表未更新。

220.181.108.97专用抓取首页IP权重段,一般返回代码是30400代表未更新。

220.181.108.80专用抓取首页IP权重段,一般返回代码是30400代表未更新。

220.181.108.77专用抓首页IP权重段,一般返回代码是30400代表未更新。

123.125.71.117抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创或是采集文章。

注:以上IP尾数还有很多,但段位一样的123.125.71.*段IP代表抓取内页收录的权重比较低,可能由于你采集文章或拼文章暂时被收录但不放出来.。


220.181.108.83专用抓取首页IP权重段,一般返回代码是30400代表未更新。

220.181.108.*段IP主要是抓取首页占80%,内页占30%,这此爬过的文章或首页,绝对24小时内放出来和隔夜快照的!

一般成功抓取返回代码都200,返回304代表网站没更新。


介绍

还不知道要介绍点什么,先将就下。

筱昵博客
联系QQ