经发现。虽然wget遵循 robots.txt 规则。但是那个还是可以绕过去。现在把我自己使用的屏蔽方法分享给大家:
1. 屏蔽下载任何文件
.htaccess
?
123456 | SetEnvIfNoCase User-Agent "^wget" bad_bot <Limit GET POST>
Order Allow,Deny
Allow from all
Deny from env=bad_bot </Limit> |
2. 屏蔽下载部分文件
.htaccess
?
12345678 | SetEnvIfNoCase User-Agent "^Wget" bad_bot SetEnvIfNoCase User-Agent "^Wget/1.5.3" bad_bot SetEnvIfNoCase User-Agent "^Wget/1.6" bad_bot <Files ~ "\.(html|pdf|mp3|zip|rar|exe|gif|jpe?g|png|php|jsp) $"> Order Allow,Deny Allow from all Deny from env=bad_bot </files> |
更多服务器知识文章推荐:
本文标题:apache使用.htaccess文件实现屏蔽wget下载网站内容
本文地址:https://gpu.xuandashi.com/40871.html,转载请说明来源于:渲大师
声明:本站部分内容来自网络,如无特殊说明或标注,均为本站原创发布。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。分享目的仅供大家学习与参考,不代表本站立场!
本文地址:https://gpu.xuandashi.com/40871.html,转载请说明来源于:渲大师
声明:本站部分内容来自网络,如无特殊说明或标注,均为本站原创发布。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。分享目的仅供大家学习与参考,不代表本站立场!