比方说,我有HTML中,看起来像这样一个数据库:PHP正则表达式否定对于YouTube网址
Hello world!
<a href="https://www.youtube.com/watch?v=m7t75u72vd">ABC</a>
Blah blah blah...
https://www.youtube.com/watch?v=df82vnx07s
Blah blah blah...
<p>https://www.youtube.com/watch?v=nvs70fh17f3fg</p>
现在我想用PHP正则表达式来获取第二和第三的网址,却忽略了第一。
正则表达式方程我至今是:
\s*[a-zA-Z\/\/:\.]*youtu(be.com\/watch\?v=|.be\/)([a-zA-Z0-9\-_]+)
它工作得很好,但我不知道如何使它排除/否定第一种类型的URL,其中一个开头:HREF =”
请帮帮忙,谢谢
提取与DOM文档/ DOMXPath文本节点第一(避免链接),然后搜索他们每个人的创造(最终)新的链接节点。 –
我想使用preg_match在PHP中执行所有操作,因为HTML位于数据库中,而且我的代码已经为其构建。 – liquidgraph
不要使用正则表达式来解析HTML。 http://php.net/DomDocument – miken32