德国蜘蛛爬虫 compatible; DataForSeoBot/1.0; +https://dataforseo.com/dataforseo-bot


compatible; DataForSeoBot/1.0; +https://dataforseo.com/dataforseo-bot

最近看日志无意间发现这个蜘蛛爬虫,看样子应该是国外的,毕竟带了链接地址。也去了解了下是国外的seo运营公司的,然后百度了下,相关资料比较少,算了,既然是国外的蜘蛛爬虫,应该是遵循robots协议吧,就去robots里面加了

User-Agent: DataForSeoBot
Disallow: /

,然后过了1天1晚,我擦执行了

cat www.xuenarui.com | grep -E ' DataForSeoBot/1.0; '|wc -l,居然有好几万。好家伙!

那我就封禁该ip吧,立竿见影,日志没有出现该蜘蛛日志。欣喜若狂!

又过了一晚上,早上来了还是老套路

cat www.xuenarui.com | grep -E ' DataForSeoBot/1.0; '|wc -l

我的乖乖,又出现了几万,对方ip更换了,好吧,实在不行的话只能出必杀技了

nginx配置文件,
Server {
……
if ($http_user_agent ~ "DataForSeoBot/1.0" )
{
      return 403;
}
……
}

只能user-agent封杀了,经历了该事件,发现国外蜘蛛也没有那么所谓讲武德!看样子robots和ip封杀也不行,只能说遇到一个尽可能的通过user-agent进行封杀吧。

欢迎大家分享下自己的心得!


热门文章

  • 体育总局冬运中心关于选派2023-2024赛季全国高山滑雪冠军赛技术官员的函
  • 体育总局冬运中心关于公示第十四届全国冬季运动会冬季两项项目参赛运动员名单的函
  • 中国滑雪协会关于发布全国滑雪俱乐部精英联赛(吉林站)竞赛规程的通知
  • 体育总局冬运中心关于第十四届全国冬季运动会冬季两项项目替换运动员的通知
  • 体育总局冬运中心关于公布第十四届全国冬季运动会单板滑雪U型场地等项目决赛参赛运动员名单的通知
  • 体育总局冬运中心关于公布第十四届全国冬季运动会冬季两项项目参赛运动员名单的通知
  • 体育总局冬运中心关于取消举办2023-2024赛季全国冬季两项冠军赛的通知
  • 体育总局冬运中心关于选派裁判员参加2023-2024赛季单板滑雪平行项目全国冠军赛暨国际雪联FIS积分赛的函
  • 中国滑雪协会关于全国滑雪俱乐部精英联赛(吉林站)的补充通知
  • 2023-2024赛季全国跳台滑雪冠军赛竞赛规程
  • 2023-2024赛季全国高山滑雪冠军赛竞赛规程
  • 体育总局冬运中心关于选派2023-2024赛季全国高山滑雪锦标赛暨第十四届全国冬季运动会高山滑雪资格赛技术官员的函
  • 体育总局冬运中心关于发布2023-2024赛季全国自由式及单板滑雪U型场地冠军赛竞赛规程的通知
  • 体育总局冬运中心关于发布2023-2024赛季全国自由式及单板滑雪大跳台和坡面障碍技巧冠军赛竞赛规程的通知
  • 体育总局冬运中心关于公示第十四届全国冬季运动会越野滑雪项目参赛运动员名单的函