我已经禁止某些使用robots.txt的页面用于所有搜寻器。我是否必须为这些文件编写元标记,否则网络爬虫只会跳过它们,因此不需要这样做?robots.txt不允许属性
0
A
回答
1
你很好走。所有的大搜索引擎(谷歌,真的)都服从你在robots.txt
中的任何条目。 http://www.robotstxt.org/robotstxt.html
此外,请注意robots.txt
文件本身是可见的,因此不要将其用作安全措施。 http://www.cre8asiteforums.com/forums/index.php?showtopic=55546
1
写得很好的机器人会忽略这些页面(前提是robots.txt的语法是正确的)。
2
如果你想限制爬行器服从robots.txt,那么你很好,但如果它没有那么你可能会拧紧,因为它很可能会忽略meta。
所有主要的搜索引擎抓取工具都会遵从它,所以你可能没问题。
相关问题
- 1. robots.txt不允许AMP页面
- 2. Gmail不允许margin属性
- 3. robots.txt的:不允许子目录,但允许目录
- 4. Robots.txt允许子文件夹,但不允许子文件夹
- 5. Robots.txt不允许subdirectoy,但允许在该文件夹
- 6. 不允许在robots.txt中使用Cobrand吗?
- 7. robots.txt文件不允许选项
- 8. robots.txt文件不允许根目录wordpress
- 9. HTMLPurifier允许属性
- 10. 允许UnsafeUpdates属性
- 11. HtmlPurifier - 允许名称属性
- 12. TinyMCE,允许数据属性
- 13. Typescript - 属性的允许值
- 14. GeoJSON:FeatureCollection中允许属性?
- 15. 错误的connectionStringName属性不允许
- 16. Swagger:不允许的其他属性:allOf
- 17. Onclick属性不允许在某一点
- 18. 父属性是不允许的
- 19. MVC 3“configProtectionProvider”属性是不允许
- 20. 远程属性不允许发布
- 21. Singleton NSMutableDictionary属性将不允许setObject:forKey
- 22. 不允许自定义属性
- 23. 允许Html属性找不到[AllowHtml]
- 24. @Column(S)不允许在@ManyToOne属性
- 25. w3c标记验证“属性,不允许”
- 26. Spring LdapTemplate - 属性'gidNumber'不允许异常
- 27. 允许和禁止在robots.txt文件中
- 28. 只允许Google CSE并且不允许在ROBOTS.txt中使用Google标准搜索
- 29. 分配给'readonly'属性的属性不允许
- 30. 分配属性只读属性不允许