2013-01-14 22 views
1

我试图用dom解析器和jsoup库解析html页面。 我面临的问题是这样的:在Java中解析之前执行单击网页元素

在网站上有两个按钮显示两个不同的表。 我需要解析当第二个按钮被点击时显示的表格。 然后设置不同的属性值。

当我做Jsoup.connect("example.com")

我得到像第一按钮响应被选中,我并不需要这些数据。

有没有办法执行点击第二个按钮,然后开始解析和检索网站的数据?

+0

看到这个http://stackoverflow.com/questions/7508813/can-jsoup-simulate-a-buttonpress – CAMOBAP

回答

2

JSoup无法控制网页,只能解析内容。对于操作和交互,有一些工具。我推荐Geb,它使用带有JQuery语法的Groovy DSL,使其非常流畅。用它解析xml/html也很容易。

3

Jsoup只是一个解析器,即它不能处理诸如点击按钮之类的事件。看看浏览器自动化工具(例如Selenium)来执行这种工作。

1

JSoup是一个HTML解析器,而不是浏览器的替代品。看看Html Unit

HtmlUnit是一个“Java程序的GUI-Less浏览器”。它模拟HTML文档,并提供一个API,使您可以调用页面,填写表单,单击链接等,就像在“普通”浏览器中执行的操作一样。

相关问题