12
A
回答
14
要知道,有没有真正的官方标准,任何网络爬虫可以愉快地忽略你的robots.txt
据a Google groups post,以下的作品至少有Googlebot的;
User-agent: Googlebot
Disallow: /directory/
Allow: /directory/subdirectory/
2
如果这些都是真正的目录,那么接受的答案可能是您最好的选择。但是,如果您正在编写应用程序并且目录是动态生成的路径(例如上下文,路由等),那么您可能想要使用元标记而不是在robots.txt中定义它。这为您提供了无需担心不同浏览器如何解释/优先访问子目录路径的优势。
你可以尝试这样的事情代码:
if is_parent_directory_path
<meta name="robots" content="noindex, nofollow">
end
1
我会建议使用谷歌的机器人测试仪。利用谷歌网站管理员工具 - https://support.google.com/webmasters/answer/6062598?hl=en
您可以在工具中编辑和测试URL,并且您还可以获得大量其他工具。
相关问题
- 1. Robots.txt不允许subdirectoy,但允许在该文件夹
- 2. 不允许文件夹浏览但允许文件请求(Apache)
- 3. Htaccess不允许访问文件夹和子文件夹
- 4. 允许子文件夹在.hgignore
- 5. robots.txt:如何禁止所有子目录,但允许父文件夹
- 6. 如何拒绝父文件夹访问子文件夹,但仍然允许直接访问子文件夹?
- 7. robots.txt的:不允许子目录,但允许目录
- 8. 允许主域名和不允许通过.htaccess访问子文件夹
- 9. 不允许使用robots.txt的文件夹组
- 10. gitignore允许某个文件只在命名的子文件夹
- 11. 不允许文件夹访问
- 12. 如何通过子域只允许子文件夹exculsive访问
- 13. robots.txt文件不允许选项
- 14. robots.txt文件不允许根目录wordpress
- 15. 为什么Eclipse不允许我正确创建子文件夹?
- 16. CodeIgniter 2不允许控制器的多级子文件夹
- 17. CORS htaccess只允许某些URL到文件夹和子文件夹的AJAX
- 18. 拒绝访问文件夹,但允许访问该文件夹内的文件
- 19. 允许在laravel公用文件夹
- 20. 允许NGINX写入文件夹/ xibo/*
- 21. 规则,允许在.htaccess文件夹
- 22. 允许访问使用htaccess文件夹
- 23. 重定向到子文件夹,但允许访问其他子文件夹,如果用的.htaccess
- 24. Eclipse'允许源文件夹的输出文件夹'
- 25. 允许访问Codeigniter中的\ application \文件夹内的文件夹
- 26. 允许和禁止在robots.txt文件中
- 27. 的.htaccess允许特定的子文件夹只有
- 28. 允许从根目录子文件夹索引htaccess
- 29. WordPress允许直接访问上传/子文件夹
- 30. 电子只允许保存到文件夹
我想动态地允许子目录,但不是第一级,将允许语句改为“允许:/目录/ * /'的作品。 – Duncanmoo
根据robots.txt维基百科条目,'允许'指令应放在'不允许'之前,以达到最大兼容性(尽管Google或Bing都不介意) – pelms