2012-01-22 15 views
0

我喜欢从安卓应用程序中的目录/商店中访问网页中的一些数据。新手:如何访问像网站这样的商店/目录的内容?

对于一个具体的例子:这是马克Twains书籍亚马逊上市的网址:

http://www.amazon.com/s/ref=nb_sb_noss/180-5768314-5501168?url=search-alias%3Daps&field-keywords=mark+tain&x=0&y=0#/ref=nb_sb_noss_1?url=search-alias%3Daps&field-keywords=mark+twain&rh=i%3Aaps%2Ck%3Amark+twain

1)如果我有上面的网址如何获得如

  • 条目的数量和
  • 为每个条目与标题(也许图像)行?其中可能包括如何遍历所有后续页面并访问每个条目。

什么是最好的(正确+兼容+高效)的方式来做到这一点? 我得到了jquery可能有用的印象。但到目前为止,我对HTML和Javascript的知识只是基本的。

2)如何查询所有Mark Twains书籍的URL?

3)这个和类似的话题的任何建议阅读?

感谢您的时间,祝您有美好的一天!

托马斯

回答

2

你会得到很好的建议不是“screen scrape”其他网站。除了难以维护(随着网站的变化等) - 这实际上会违反许多网站的使用条款/服务(TOS)。

取而代之,请查看期望的网站是否提供可以使用的Web服务。这些将以更易于使用的格式返回数据,例如JSON或XML。您通常也会获得自己的开发人员密钥(以跟踪请求),以及其他可能的功能,如果直接使用HTML,您将无法获得这些功能。

亚马逊,特别是,当然提供这个。详情请参阅https://affiliate-program.amazon.com/gp/advertising/api/detail/main.html。 (不要被“广告”的命名所困惑。)

+0

好的。看起来亚马逊是一个不好的例子。我只是接受它,因为它是广为人知的,可能比我想到的某个特定页面更通用一些。 例如,我喜欢浏览和提取像http://www.quotationspage.com这样的网页中的引号。我想到的其他网站甚至不太知道,并且肯定不会有这样的API。 – abraxas