当前所在位置: 首页>>生活常识

通过IP反查(nslookup)判断百度蜘蛛IP真假

发布时间:2021-10-20 15:58:42 本站作者 【 字体: 】 浏览:173 次

我们经常会碰到黑客利用伪装蜘蛛扫描网站,今天我们介绍下如何利用IP反查方法,判断蜘蛛是否为百度搜索引擎蜘蛛。

以百度为例,通常我们判断是否是百度蜘蛛抓取看用户代理字符串也就是User-Agent,但是User-Agent是可以模拟的,所以很多时候也会有虚假的模拟伪装成百度蜘蛛来抓取,这时候我们就需要学会分辨真伪。

搜素引擎蜘蛛

首先是百度User-Agent代理字符串,百度官方公布的有如下User-Agent:

移动UA:Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,likeGecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

PC UA:Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

新增渲染UA:

移动UA:Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 likeMac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143Safari/601.1 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

PC UA:Mozilla/5.0 (compatible;Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

需要注意的是百度新增了一个移动的User-Agent,和一个PC的User-Agent。我们知道了百度蜘蛛的User-Agent,如何正确识别和判断某条抓取是否是真实的百度蜘蛛。

如何识别百度蜘蛛

1、首选我们需要通过关键词找User-Agent中是否包含Baiduspider;

2、如果想区分移动和PC的蜘蛛的话,我们还需要在结果中再进行关键词过滤,移动端的User-Agent包含:Android 、iPhone、Mobile等三个中至少一个。

3、通过上述操作我们可以分辨出哪些抓取是百度蜘蛛抓取,但并不能分辨真伪。


上一篇:robots协议禁止收录网站某一篇文章地址

下一篇:长尾关键词快速获取排名方法

广告位-300PX*250PX
最新发布
什么的雷声填空答案

什么的雷声填空答案

什么的雷声填空答案
什么的雷声填空答案震耳的雷声,遥远的雷声,响亮的雷声,恐怖的雷声,轰隆隆的雷声,沉闷的雷声等。雷击,指打雷时电流通过人、畜、树木、建筑物等而造成杀伤或破坏。云层之间的放电对飞行器有危害,对地面上的建筑物和人、畜影响不大,但云层对大地的放电,则对建筑物、电子电气设备和人、畜危害甚大。一但对万物造成危害...
什么叫双核

什么叫双核

什么叫双核
什么叫双核1.双核cpu也就是多了一个核心芯片组成的就是双核cpu处理器。2.cpu是电脑的核心,而cpu上面最重要的也是cpu芯片,在我们电脑在处理数据的计算、接受存储的时候就是通过cpu上面的芯片来执行的。CPU内部拥有的核心数量在很大程度上也决定了该处理器的处理器性能,所以多核心CPU可以同时处理器更多数据,在性能方面也...
胶东指的是什么

胶东指的是什么

胶东指的是什么
胶东指的是什么胶东地区是指胶莱谷地及其以东具有相同语言、文化、风俗、习惯的半岛地区。按语音、文化、风俗习惯细分为烟台、威海的丘陵地区,和青岛市区、潍坊市等胶莱河两岸平原地区。胶东以莱阳梨,烟台苹果,胶东馒头等著名于世。...
mac地址存在于哪里

mac地址存在于哪里

mac地址存在于哪里
mac地址存在于哪里网卡。mac地址通常存储在计算机的“网卡”上。网卡属于OSI模型的物理层,只传输信号,不分析高层数据;MAC地址是全球唯一的,是一个用来确认网络设备位置的位址,通常固化在计算机的网卡上。如果想查看mac地址可以在 开始运行cmd 然后在后面输入ipconfig/all其中 physical address所对应的就是。...