2010-07-21 191 views

回答

6

<title>(.*?)</title>这样的正则表达式会为您提供标题内容。 。*?部分用于匹配任何字符,以非贪婪的方式(如果页面中有另一个标题结束标记)。

+0

PLS HW去有关这一点,新的正则表达式 – 2010-07-21 11:12:32

+0

感谢我把它 – 2010-07-21 11:41:57

2

您应该使用HTML分析器而不是正则表达式。例如,请参阅Simple HTML DOM

您的任务的正则表达式将非常难以维护,并且在有关页面的任何更改时都会很容易中断,更不用说您不能说明HTML注释。

+0

+1,但我敢肯定,你可以使用正则表达式删除HTML注释。 – 2010-07-21 10:33:26

+0

我从来没有使用过简单的HTML DOM,我该如何去做。 我想我会安装任何东西... – 2010-07-21 11:10:13

1

我刚刚创造了这个表达式,它获取标签内的文本(节点值),而没有实际的标签本身。

(?<=\"\>)(.*?)(?=\<\/)

您可以用PHP在这里看到它在行动:http://codepad.viper-7.com/AUTcv3

+0

链接现在只显示你好世界的例子 – CodingYourLife 2015-01-28 00:06:38

相关问题