jsoup

    2热度

    3回答

    ,我需要用jsoup从这个网站 <div class="picture"> <img src="http://asdasd/aacb.jpgs" title="picture" alt="picture" /> </div> 我需要提取该img标签的src ... 我使用这个代码我得到空值提取图像标签 Element masthead2 = doc.select("div.pict

    4热度

    4回答

    我正在构建一个应用程序,从网页上刮取信息。为此,我选择使用名为Jsoup的html刮板,因为它非常易于使用。 Jsoup也依赖于Apache Commons Lang libray。 (他们共计总共385kB)。 所以Jsoup将被用来下载页面并解析它。 我的问题是,如果使用这些简化库而不是使用Android内置库,会使我的应用程序变慢? (就下载数据和解析而言)。 我在想内部库会针对Androi

    0热度

    4回答

    我的任务是查找给定链接的实际新闻稿链接。例如说http://www.apple.com/pr/。 我的工具必须从上述URL中单独找到新闻稿链接,不包括其他广告链接,在该网站中找到的标签链接(或其他)。 下面的程序是开发的,其结果是给出的网页中存在的所有链接。 如何修改下面的程序以从给定的URL中单独查找新闻稿链接? 此外,我希望该程序是通用的,以便从任何新闻稿URL中识别新闻发布链接(如果有的话)

    5热度

    2回答

    我正在使用名为Jsoup的HTML解析器来加载和解析HTML文件。问题是我刮的网页编码为ISO-8859-1字符集,而Android使用UTF-8编码(?)。这是一些字符显示为问号的结果。 所以现在我想我应该将字符串转换为UTF-8格式。 现在我发现这个类在Android SDK中叫做CharsetEncoder,我猜可以帮助我。但我不知道如何在实践中实现它,所以我想知道是否可以通过一个实际的例子

    41热度

    10回答

    嗯,我非常想弄清楚如何从网页中提取信息,并将其带入我的程序(Java)。 例如,如果我知道我想从中获取信息的确切页面,为了简化百思买项目页面,我将如何从该页面获取我需要的相应信息?像标题,价格,描述一样? 这个过程甚至会被称为什么?我不知道甚至开始研究这个。 编辑: 好吧,我跑了JSoup测试(一张贴BalusC),但我不断收到此错误: Exception in thread "main" jav