jsoup

    0热度

    1回答

    我有以下的html html代码: 我想解析的文本显示为红色箭头。这是我试图解析h2: Elements elements = document.select("div#app div#timetable-content-holder h2"); 但不幸的是elements的大小是零。 但我检查了document.select(div#app).size()是1,但document.selec

    1热度

    1回答

    对于我的搜索引擎,我想根据标签及其文本索引HTML文档。这样我可以例如将标题继承到段落。 比如我给下面的DOM: <body> <div1> one <h2> two </h2> <div2> three <div3> four </div3> </div2> <p> five </p> six </div1

    1热度

    1回答

    也许有人可以帮助我使用jsoup从HTML中提取信息? 需要的信息是23.90 <tr> <td class="leftcell" valign="top"> <div onclick= "ShowHideTravelDetails('bookingPrice_TaxesToggleBox', 'bookingPrice_TaxesToggleIcon', '/Im

    0热度

    1回答

    我想在Java中使用JSOUP在输入字段中废弃在网页中输入的值。输入字段中的值已被服务器添加。 在JavaScript中,我们用它来选择由ID的元素,然后很容易地得到使用.value所示在下面的图片的值。 这是HTML的样子 我想知道如何与JSOUP和Java做到这一点。

    1热度

    1回答

    我试图检索www.lifehack.org 我Jsoup(失败),然后用JBrowserDriver尝试过的内容(失败过) - >内容始终是'掩码'的JavaScript。 有没有办法在java中检索HTML内容?什么是不工作 例子: POM: <groupId>com.machinepublishers</groupId> <artifactId>jbrowserdriver</artifac

    1热度

    2回答

    我想解析一个使用Jsoup的HTML文件。 HTML中有某些文本不在标签下。 <li class="inactive"> <span class="status label">inactive</span> <a href="/officers/144662696" class="officer inactive" title="more info on MILLTOWN CO

    0热度

    1回答

    我的要求是通过在线搜索关键字来对给定关键字进行报告。 我的计划是,我的WebCrawler将 在谷歌搜索或谷歌,必应和雅虎 返回网站的冰或雅虎 打开网页/链接关键字使用使报告这些页面。 因为我想做一个规则服从webcrawler。所以,当我看到这些网站的robots.txt我才知道,搜索引擎已经封锁了WebCrawler的搜索关键字,如 google.com/robots.txt User-age

    0热度

    1回答

    我的代码每5秒读一个新文件。从该文件中,我获取状态,如“通过”和“失败”并写入html文件。一切工作正常,但我的问题是我也希望以前的结果,但它没有发生。 假设我正在读取file1,然后我将结果写入html文件,然后再次读取另一个file2,结果也写入了相同的html文件。任何人都可以请指导我如何做到这一点?我已经尝试了几次,但没有成功。 下面是我想要实现相同的方法。如果需要的话,我也会把整个代码。

    1热度

    1回答

    我刚刚开始探索Jsoup并面临以下问题:当我尝试从仅属于维基百科英文版的https://en.wikipedia.org/wiki/Knowledge中提取链接时,正常工作。 Document document = Jsoup.connect("https://en.wikipedia.org/wiki/Knowledge").timeout(6000).get(); Elements

    1热度

    1回答

    这里是我尝试使用我的方法来打开链接: https://www.deviantart.com/download/652802405/sugar_rush_by_rainbow_highway-dasntk5.png?token=2080f7bdd7953b1b5128e45fe1f8d06c6ba8c4f1&ts=1506130109 这里是我打开它的代码和它不工作.... ​​ 我想首先知道这个词