jsoup

2热度

3回答

，我需要用jsoup从这个网站 <div class="picture"> <img src="http://asdasd/aacb.jpgs" title="picture" alt="picture" /> </div> 我需要提取该img标签的src ... 我使用这个代码我得到空值提取图像标签 Element masthead2 = doc.select("div.pict

4热度

4回答

外部库是否使应用程序更慢？

我正在构建一个应用程序，从网页上刮取信息。为此，我选择使用名为Jsoup的html刮板，因为它非常易于使用。 Jsoup也依赖于Apache Commons Lang libray。（他们共计总共385kB）。所以Jsoup将被用来下载页面并解析它。我的问题是，如果使用这些简化库而不是使用Android内置库，会使我的应用程序变慢？（就下载数据和解析而言）。我在想内部库会针对Androi

0热度

4回答

单独标识新闻稿页面的链接

我的任务是查找给定链接的实际新闻稿链接。例如说http://www.apple.com/pr/。我的工具必须从上述URL中单独找到新闻稿链接，不包括其他广告链接，在该网站中找到的标签链接（或其他）。下面的程序是开发的，其结果是给出的网页中存在的所有链接。如何修改下面的程序以从给定的URL中单独查找新闻稿链接？此外，我希望该程序是通用的，以便从任何新闻稿URL中识别新闻发布链接（如果有的话）

5热度

2回答

如何在Android中将字符串转换为UTF-8？

我正在使用名为Jsoup的HTML解析器来加载和解析HTML文件。问题是我刮的网页编码为ISO-8859-1字符集，而Android使用UTF-8编码（？）。这是一些字符显示为问号的结果。所以现在我想我应该将字符串转换为UTF-8格式。现在我发现这个类在Android SDK中叫做CharsetEncoder，我猜可以帮助我。但我不知道如何在实践中实现它，所以我想知道是否可以通过一个实际的例子

41热度

10回答

如何“扫描”一个网站（或页面）的信息，并将其带入我的程序？

嗯，我非常想弄清楚如何从网页中提取信息，并将其带入我的程序（Java）。例如，如果我知道我想从中获取信息的确切页面，为了简化百思买项目页面，我将如何从该页面获取我需要的相应信息？像标题，价格，描述一样？这个过程甚至会被称为什么？我不知道甚至开始研究这个。编辑：好吧，我跑了JSoup测试（一张贴BalusC），但我不断收到此错误： Exception in thread "main" jav