2015-12-09 52 views
-2

我想从以下给出的文本获取文本之间的链接

<a href="/film/3022900-12-years-a-slave" class="item-link"> 所需的数据/film/3022900-12-years-a-slave只是href="后需要数据获取URL和"

之间我使用

"\w+ 
+0

请提供有关您遇到的问题的更多信息。 – Maroun

+0

您是否也可以提供所需的输出,更多的信息会对您有所帮助 –

+1

通常,解析锚点并获取href可能存在问题。然而,你可以想出某事。像'href =“([^”] +)'。也就是说,匹配href =“从字面上看,然后将所有内容匹配到一个双引号内,但请提供其他信息(例如编程语言)。 – Jan

回答

1

如果这是唯一的文字,也没有其他的HTML,那么你可以使用下面的正则表达式:

href="([^"]+) 

或者您也可以使用lookbehind,具体取决于您的情况。

(?<=href=")([^"]+) 

但如果是大的HTML文件的一部分,那么你应该使用任何DOM或类似解析器(可能)。

+0

谢谢它适用于我 – Anoop