我有以下HTML,并且我需要获取粗体标记之外的文本。例如“提交时间:”我需要获取后面的时间戳。您会看到'提交时间:被大胆标记包围,时间戳记如下,我无法检索它。如何使用watir webdriver检索innerhtml
<body>
<h2> … </h2>
<b> … </b>
jenkins
<br></br>
<b> … </b>
<br></br>
<b> … </b>
<a href=""> … </a>
<br></br>
<b> … </b>
<br></br>
<b>
Submitted At:
</b>
29-Jan-2016 17:12:24
我试过的东西。
@ browser.body.text.split( “\ n” 个)
@ browser.body.split( “\ n” 个)
body_html =引入nokogiri :: HTML.parse(@browser。 。body.html)
body_html.xpath( “// //身体b”)文本
- 返回:“用户:作业名:JobConf:工作的ACL:所有用户都allowedSubmitted在:在推出:完成时间:状态:分析此作业“
我已经尝试过几种方法,比如xpath,普通的旧文本检索,但是我无法得到我需要的东西。我也做过几次搜索,找不到我需要的东西。
它看起来很脆弱和跛脚,但你可以链'String :: scan'来拉时间戳。构造示例:'b.text.scan(/ \ d。* \ d /)' – orde
请阅读“[问]”,包括底部的链接和“[mcve]”。我们需要看到你试图解决问题,否则它看起来像你想让我们为你写代码。 –
你可能会更好,只是将它解析为一个巨大的字符串。 upvoting只是为了防止新用户失去业力。也投票结束 –