如果我想阻止访问我的服务器中的所有.py文件,但允许与该.py文件位于同一文件夹中的所有文件,我应该在我的robot.txt中放入什么?这是我有权,现在:在robot.txt中阻止访问
User-Agent: *
Disallow: /*_.py
如果我想阻止访问我的服务器中的所有.py文件,但允许与该.py文件位于同一文件夹中的所有文件,我应该在我的robot.txt中放入什么?这是我有权,现在:在robot.txt中阻止访问
User-Agent: *
Disallow: /*_.py
没有“定义标准” robots.txt
文件,但聚集在http://www.robotstxt.org/大量的信息。
在http://www.robotstxt.org/robotstxt.html,它指出:
具体来说,你不能有像行 “用户代理:*机器人*”, “禁止:/ tmp目录/ *” 或 “不允许:* .gif注意” 。
虽然有些爬虫做允许通配符,如果你想有一个可靠的解决方案你最安全的选择将是假设没有履带会采取你Disallow:
线进去了,建议你找一个替代解。否则,你将实施一个解决方案,将有一些搜索引擎的支持,同时让你的网站向其他人开放。
为什么'* _。py?'你不想'* .py'? – Blender
该文件必须命名为“robots.txt”,而不是“robot.txt”。 – unor