有一个以下的HTML,请问我可以如何使用JSoup从"<html"
到"<a id="summary"></a>"
的文本,尝试了以下正则表达式,但它返回的是空字符串。基于使用JSoup的标签范围的HTML搜索
doc.select("*:matches(^[<html]*[a>]$)")
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title>TestNG: Unit Test</title>
</head>
<body>
<a id="summary"></a>
<table cellspacing=0 cellpadding=0 class="param" style="float: left; width:630px;">
<tr><th>Test</th><th class="numi">Methods<br/>Passed</th><th class="numi">Scenarios<br/>Passed</th><th class="numi"># skipped</th><th class="numi"># failed</th><th class="numi">Total<br/>Time</th><th class="numi">Included<br/>Groups</th><th class="numi">Excluded<br/>Groups</th></tr>
</table>
</body></html>