2014-02-07 48 views
-2

我对Java很新,我不知道如何从Java中提取部分而不使用HTML Parser。使用Java从标记中提取URL

让我们假设我有以下标签:

<img width="506" height="200" src="Jozo/image014.png" v:shapes="image_x0020_1" /> 

我想使用正则表达式可能提取Jozo/image014.png但将是巨大的,如果有人可以帮助我这个...

非常感谢您

+1

没有解析器是可能的,但你为什么要这样做? – nhahtdh

+2

请不要使用正则表达式从xml格式中提取信息。 –

+0

,因为我将使用它来更改属性值。 – user3278450

回答

2

使用HTML解析器Regex是不准确的解析HTML内容

String htmltag = "<img width=\"506\" height=\"200\" src=\"Jozo/image014.png\" " 
     + "v:shapes=\"image_x0020_1\" />"; 
Document doc = Jsoup.parse(htmltag); 

Elements ImageUrl = doc.select("img"); 
for (Element el : ImageUrl) 
    System.out.println(el.attr("src")); 
+0

恩,你可能想逃避那些引用,以便工程。 – leigero