我在使用HtmlUnit
解析html页面时遇到两个问题(实际存在问题)。我尝试了他们的“入门”以及搜索谷歌,但没有帮助。这是我的第一个问题。如何使用HtmlUnit从HTML页面中提取元素
1)我想提取网页
<b class="productPrice">Five Dollars</b>
2)我想提取整个文本(包括附加展或链接文字下面bold
标签的文本,如果存在的话)在最后一个段落在以下结构中
<div class="alertContainer">
<p>Hello</p>
<p>Haven't you registeret yet?</p>
<p>Registrations will close on 3 July 2012.<span>So don't wait</span></p>
</div>
你可以请单行代码片段我该怎么做?我是HtmlUnit的新手。
编辑:
HtmlUnit的getElementByName()
和getElementById()
,所以我们如何使用,如果我们想用类选择?
这将是我的第一个问题的答案。
您是否尝试过'getElementsByAttribute()'和'getOneHtmlElementByAttribute()'? (其中attributeName是“class”) – MattR