2012-02-03 100 views
-1

我的输出包含multipe id和href以及其他数据。获取唯一ID和href

如何使用Htmlunit和Java代码获取所有的id和href值?

我需要得到所有HREF值强制性的,但编号是不是强制性的?

我怎样才能做到这一点,我应该在哪里写的给定的代码。

<a id="Repeater1_ctl00_HyperLink2" href="/jobs/Physical-Security-Specialist-308550900.html"> 

<a id="Repeater1_ctl05_HyperLink1" href="/jobs/Safety-and-Occup-Hlth-Specialist-308549000.html"> 

<a id="Repeater1_ctl08_HyperLink2" href="/jobs/Nurse-Practitioner-Oca-Esep-Dh-308526400.html"> 

<a id="Repeater1_ctl09_HyperLink1" href="/jobs/Nurse-Practitioner-Oca-Esep-Dh-308526400.html"> 

等.....

+5

欢迎来到堆栈溢出。恐怕我们无法帮助你,因为你的问题缺乏细节。到目前为止你尝试了什么,结果如何?另请阅读http://stackoverflow.com/questions/how-to-ask – 2012-02-03 09:29:35

回答

0

我不是为你写代码:)不过我可以给您提供解决方案的想法。

获取HtmlPage。尝试获取页面的所有HtmlAnchor对象(可以使用XPath)。迭代HtmlAnchor集合并执行方法getHrefAttribute()以获取href属性。 Similary使用HtmlAnchor的getId()方法来获取它的id。这就是它:)