正则表达式提取标签之间的文本，但不是标签

我想编写一个正则表达式，它提取字符串中的两个标签<title>之间的内容，但不是标签。 IE浏览器，我有以下正则表达式提取标签之间的文本，但不是标签

<title>My work</title> 
<p>This is my work.</p> <p>Learning regex.</p>

正则表达式

(<title>)(.*?)(<\/title>)

提取<title>My work</title>但我只想要My work提取。我怎样才能做到这一点？这是例子http://regex101.com/r/mD8fB0

来源

2013-02-22 Nicolaesse

您可以使用此以下正则表达式：

>([^<]*)<

，或者> [^ <] * <

然后消除不必要的字符，如 '<' & '>'

来源

2013-02-22 23:04:00 shasan

你能解释的'[^ <]'的含义是什么？ – 2015-07-09 13:47:12

这不适用于' Alice' - 即嵌套标签内的文本。有什么想法吗？ – PeterX 2016-02-12 02:02:42

在你的情况的链接，你可以只用第二个反向引用的正则表达式，它会抱着你感兴趣的文本。

既然你提到你的标签preg_match，我假设你想要这个PHP。

$matches = array(); 
$pattern = '#<title>(.*?)</title>#'; // note I changed the pattern a bit 
preg_match($pattern, $string, $matches); 
$title = $matches[1];

注意，这实际上是我的模式先回参考，因为我省略了周围的标签本身，这是没有必要的括号。

通常情况下，您不应该使用正则表达式来解析HTML文档，但我认为这可能是其中一种异常情况，因为标题标签应该只在页面上存在一次。

来源

2013-02-22 22:09:24

的最佳方式是使用断言，您的情况下，正则表达式应为：

(?<=\<title\>).*?(?=\<\/title\>)

更多细节看看here

来源

2014-03-22 15:09:03 najjarammar

如果换行符出现在内容中，这不起作用！ – ZOXEXIVO 2014-10-13 20:05:21

我用这个作为正则表达式的替换功能：（？< +>）

来源

2015-11-30 21:05:08 andrewster

SMART答案！我喜欢你看待事物的方式 – 2016-09-14 23:56:25

正则表达式提取标签之间的文本，但不是标签

回答

相关问题