说我有这个字符串具体的正则表达式模式
<td><a href="/one-two-three/menus" title="test"</td>
<td><a href="/one-two-three/menus/13:00 title="test"</td>
<td><a href="/one-two-three/schedule/could be multiple delimiters/14:00 title="test"</td>
我想用正则表达式来获得2分的结果,只有当满弦与/one-two-three
开始,以hh:mm
结束。例如,我想:
/one-two-three/menus/13:00
/one-two-three/schedule/could be multiple delimiters/14:00
我已经试过正则表达式/one-two-three[\s\S]+?[0-9][0-9]:[0-9][0-9]
但是这给
Found 2 matches:
1./one-two-three/menus" title="test"</td> <td><a href="/one-two-three/menus/13:00
2./one-two-three/schedule/could be multiple delimiters/14:00
我明白为什么我得到的结果,但我的问题是什么模式可以我用于排除没有hh:mm
的零件,其中可以有/one-two-three
和hh:mm
之间的任意数量的分隔符
谢谢你。 HTML在我的案例中并不重要,尽管我之前已经看到过这个链接。大多数建议的解析器(例如HTML敏捷包等)在处理几页时都很好,但在处理数百或数千响应时速度太慢。 :) – user3357963
嗯,该网页的重点不在于,使用正则表达式来解析HTML“不够优雅”。这实际上是不可能的,因为HTML不是一种常规语言。如果您的问题在HTML结构方面非常有限,那么只有使用正则表达式才能解决HTML问题。 –