我想第一次在Java中使用正则表达式。 我想获得一些字符串的一部分。该字符串是一个有点复杂:java正则表达式得到字符串的某些部分
<description>
<a href='http://testlink.html' alt='some text'><img border='0'
src='http://s2.glbimg.com/zzag70iNYX-QK24sUp0YXQmmXhx7yb8j2Sq2YK7tvX3A6vCwEUOFnFTBONQFT-
ni/s.glbimg.com/es/ge/f/original/2012/04/25/image.jpg'
alt='some' title='text' /></a><br />some text; some text
</description>
我需要的是拿到位于字符串HREF和ALT。为此我正在做这样的代码:
for(Element element : elements)
{
//Elements children = element.children();
Pattern pattern = Pattern.compile("a\\bhref=*(.html|.htm)>");
String[] data = pattern.split(element.text()); ...
}
等等。目前,我只想取得成功,但只能获得href。回报总是整个字符串。不正确?我已经把html扩展保证,并没有发生。
如果你打算解析html,为什么不使用[现有的html解析器](http://htmlparser.sourceforge.net/)? – Thomas 2012-08-08 20:36:56