我正在编写一个应用程序来获取html页面的标题,一些文本位于body标签和图像下。 这是像Facebook的份额的东西。我可以得到一个正则表达式。谢谢你的帮助。正则表达式在标签之间获取文本
回答
像<title>(.*?)</title>
这样的正则表达式会为您提供标题内容。 。*?部分用于匹配任何字符,以非贪婪的方式(如果页面中有另一个标题结束标记)。
您应该使用HTML分析器而不是正则表达式。例如,请参阅Simple HTML DOM。
您的任务的正则表达式将非常难以维护,并且在有关页面的任何更改时都会很容易中断,更不用说您不能说明HTML注释。
+1,但我敢肯定,你可以使用正则表达式删除HTML注释。 – 2010-07-21 10:33:26
我从来没有使用过简单的HTML DOM,我该如何去做。 我想我会安装任何东西... – 2010-07-21 11:10:13
我刚刚创造了这个表达式,它获取标签内的文本(节点值),而没有实际的标签本身。
(?<=\"\>)(.*?)(?=\<\/)
您可以用PHP在这里看到它在行动:http://codepad.viper-7.com/AUTcv3
链接现在只显示你好世界的例子 – CodingYourLife 2015-01-28 00:06:38
- 1. 正则表达式在标签之间获取文本
- 2. 使用正则表达式在标签之间提取标签和文本
- 3. 使用正则表达式在文本之间获取文本
- 4. 正则表达式来修改文本在标签AS3之间
- 5. 正则表达式提取标签之间的文本,但不是标签
- 6. 用正则表达式获取php标签之间的代码
- 7. 使用正则表达式来获取多个HTML标签之间的文本
- 8. 正则表达式替换标签之间的文本
- 9. 删除标签之间的文本w /正则表达式
- 10. 标签之间的文本的正则表达式
- 11. 正则表达式删除标签之间的文本
- 12. 正则表达式来修剪标签之间的文本
- 13. PHP正则表达式 - 在斜杠之间获取文本
- 14. 正则表达式在大括号之间获取文本
- 15. 使用正则表达式在引号之间获取文本
- 16. 正则表达式:如何在标签之间捕获?
- 17. 正则表达式提取HTML标记之间的文本
- 18. JavaScript正则表达式获取文本之间的词
- 19. 正则表达式替换文本之外的脚本标签
- 20. 正则表达式来移除标签之间的文本在记事本++
- 21. 正则表达式C++:提取标签之间的子串
- 22. Java正则表达式提取的标签之间的内容
- 23. vb.net正则表达式 - 捕获文本之间的文本
- 24. Ruby正则表达式:在引号之间提取文本
- 25. 正则表达式获取文本
- 26. 使用正则表达式在标签之间定位特定文本
- 27. 在JavaScript中使用正则表达式只选择标签之间的文本
- 28. 正则表达式在字符串之前获取文本
- 29. Python的正则表达式外文本与标签之间的结合文字
- 30. 正则表达式找到文件中的标签之间的文本
PLS HW去有关这一点,新的正则表达式 – 2010-07-21 11:12:32
感谢我把它 – 2010-07-21 11:41:57