扫描网站数据

2013-06-01 167 views 1 likes

我只是想知道是否可以使用扫描仪从网站上读取数据。它不一定是一个文本网页，但有图片，可点击的链接等。所以我怎样才能只扫描文本，而不是其他任何东西。这是为了一个应用程序，我会阅读可能会改变的名称。这就是为什么我想从网站上阅读它们而不是制作自己的文本文件并阅读它的原因。任何帮助都会很棒。谢谢扫描网站数据

2013-06-01 bigC5012

您将不得不使用http请求使用http请求，并从服务器获取所需的数据。扫描是什么意思？ – Raghunandan

回答

你应该使用jsoup它。使用此工具可以轻松解析HTML页面。

你可以得到的HTML文档，并可以遍历元素这里所说：

Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); 
Elements newsHeadlines = doc.select("#mp-itn b a");

入门指南简单易学：

2013-06-01 04:56:13

这似乎是最好的解决方案。我已经下载并将jar文件放入我的libs文件夹中。尽管我很难理解jsoup是如何工作的。你知道任何一步一步的教程或其他信息吗？ – bigC5012

您可以使用一个名为搔刮术：

2013-06-01 05:13:45