2017-10-09 170 views
1

我需要得到某个<br>标记的电话号码,该标记始终低于classfirmheaderJsoup从<br>得到的内容

<td class='second' valign='top'> 
<div class='firmheader'>Police departament</div> 
<br><h2 class='subtitle'>Adress</h2>New Jersey <a class='discret' target='_top' title='See NJ departamant' href='/nj/dep'>NJ</a>, Phone: +160923490434</br> 

我尝试:

Document doc = Jsoup.connect("my_url").get(); 
Element element = doc.select("br.h2").first(); 

没有成功。

+1

电话不在任何HTML元素中,你可以使用正则表达式来处理这种情况。 – aydinugur

+1

@uğuraydın最后有一个'
',对不起,为tipo –

回答

1

首先获取最近的外部标签的文本。在你的html片段中是<td><br>标签没有结束标签。

String address = doc.select("td.second").text(); 

现在你得到“警察departament AdressNew新泽西NJ,电话:160923490434”的文字,你需要使用正则表达式为得到“手机”领域。