0
A
回答
1
我已经解决了他的问题。
解决办法:
检查最新的访问者到你的域 检查其始终访问用户代理。
在我的情况,我发现YandexBot
Mozilla/5.0 (compatible; YandexBot/3.0; +http://yandex.com/bots)
现在你已经发现了正在放缓您的服务器,继续阻止它的机器人。您可以用robots.txt
或.htaccess
.htaccess
方法做到这一点:
添加以下代码在里面。
#block bad bots with a 403
BrowserMatchNoCase "Yandex" bots
Order Allow,Deny
Allow from ALL
Deny from env=bots
或者
robots.txt
方法:
添加以下代码在里面。
User-agent: Yandex
Disallow:/
就是这样。你已经阻止了这个机器人。
0
拒绝指令应该是文件段内,尝试:
<Files 403.shtml>
order allow,deny
allow from all
deny from xxx.xxx.xx.xxx
</Files>
或者,你可以使用基于国防部重写IP封锁
RewriteEngine on
RewriteCond %{REMOTE_ADDR} ^1\.2\.3\.4\.5$
RewriteRule - [F]
相关问题
- 1. 如何检查我的网站是否使用爬虫访问?
- 2. 阻止蠕虫爬行吗?
- 3. 网站/ webURL如何通过网络爬虫和机器人停止访问?
- 4. 阻止spambot访问我的网站
- 5. 我可以告诉网站爬虫访问某个页面吗?
- 6. python网站爬虫(多个网站)
- 7. 如何阻止Alexa和类似的网站访问网站
- 8. 网络爬虫的功能
- 9. 如何阻止访问我的PHP网站上的目录?
- 10. 防止自定义网络爬虫被阻止
- 11. 子域vs子目录阻止爬虫
- 12. 如何阻止某些IP(用户)访问我的网站?
- 13. 如何阻止所有手机访问我的网站
- 14. 阻止自动访问的网站
- 15. 阻止访问路由器的网站?
- 16. 如何阻止访问者直接访问我的网站中的目录?
- 17. 电子邮件链接被阻止的网页爬虫
- 18. 基于ajax的网站的php爬虫?
- 19. 网络爬虫
- 20. .htaccess阻止访问该网站
- 21. 阻止用户访问网站
- 22. 使用C#阻止网站访问#
- 23. 阻止从特定IP访问网站?
- 24. 网络爬虫不打印
- 25. 如何防止除了好的(谷歌,Bing,雅虎)访问网站内容的所有爬虫?
- 26. 反向链接报告网站爬虫?
- 27. 保护爬虫网站内容
- 28. 运行一个网站爬虫
- 29. 提前PHP爬虫,网站与后端
- 30. 爬虫/蜘蛛检测新网站
robots.txt是由它的行为,如果它想要和如果机器人是破坏性的,那么它不太可能会打扰服从那是什么。在Apache配置和/或iptables或防火墙中阻止更好。 –