78模板网分享cms建站教程,提供网站模板、网站插件、办公模板等模板教程免费学习,找模板教程就上78模板网!

屏蔽MJ12bot 蜘蛛爬虫 屏蔽垃圾SEO蜘蛛

MJ12bot 蜘蛛爬虫 屏蔽垃圾SEO蜘蛛

Majestic是英国的专业搜索引擎,成百上千的企业使用13种语言和60多个国家/地区来绘制互联网地图,这些地图独立于基于消费者的搜索引擎。Majestic还支持其他合法技术,这些技术有助于了解不断变化的Web结构。网站所有者可以在majestuc上查看有关其自己网站的数据。

爬取 User-Agent

Mozilla/5.0 (compatible; MJ12bot/v1.4.8; http://mj12bot.com/)

robots.txt 拦截

User-agent: MJ12bot

Disallow: /

如何降低MJ12bot的速度?

您可以通过将以下内容添加到robots.txt文件中来轻松降低bot的速度:

User-Agent: MJ12bot

Crawl-Delay: 5

抓取延迟应为整数,表示两次请求之间等待的秒数。MJ12bot将在两次向您的站点发出请求之间最多延迟20秒-但是请注意,尽管这不太可能,但您的站点仍可能同时从多个MJ12bot爬网。进行较高的抓取延迟可以最大程度地减少对您的网站的影响。如果将此抓取延迟参数用于*通配符,则该参数也将处于活动状态。

如果我们的机器人检测到您对任何其他机器人都使用了抓取延迟,则即使没有特别要求MJ12bot,它也会自动缓慢爬行。

本文链接:http://78moban.cn/post/9797.html

版权声明:站内所有文章皆来自网络转载,只供模板演示使用,并无任何其它意义!

联系技术
文章删除 友链合作 技术交流群
1050177837
公众号
公众号
公众号
返回顶部