2010-05-20 44 views
1

我想作为一个新手程序员知道什么好处是使用谷歌搜索API或最新的buzz API来收集数据内容而不是屏幕抓取;显然除法律方面外。搜索API与屏幕抓取

回答

1

API比屏幕布局更不可能改变。

+0

谢谢您的回复。当你说改变时,你是什么意思? 从我读过的内容中我将需要获得一个帐户;然后创建一些访问API的脚本,由于Google Buzz API文档没有多大帮助,我仍然不清楚该如何操作,并创建查询将其发布到API。我回来的结果是我通常在手动搜索屏幕上看到的结果吗?所以我能够让脚本定期运行这些查询? – vbNewbie 2010-05-20 18:52:08

+0

他意味着Google Buzz的页面布局(只是一个示例)可以被修改,以便您的scraper不起作用。 但是,API通常是保持机智的,因为它们被程序员用来与服务交互,并且它们不会破坏所有先前存在的应用程序。 – 2010-05-20 18:58:13

+0

谢谢精度。是否只能使用java代码访问google API,以及如何访问例如Google Buzz API。如果这是网站地址http://code.google.com/apis/buzz/我如何从代码访问此网站,并且我没有网站 – vbNewbie 2010-05-20 19:07:14

1

屏幕抓取的一大缺点是屏幕可以改变和打破你的刮板。因此,您最终必须不断调整代码以匹配他们的代码,并且由于您不提前知道更改,因此会导致停机/中断。
此外,你可能违反了他们的服务条款,他们不会喜欢它。如果您为您的服务付费客户,您可以很快找到自己处于困境和困境之中。 另外,如果您模拟了很多用户,则会在服务器上产生意料之外的拖动。因此,使用发布的/允许的API对于您和为网站提供源材料的网站会更加高效。

+0

因此,如果我的理解正确,访问谷歌API只涉及有一个谷歌帐户,这些天他们验证通过发送代码到手机。 API服务是否返回与正常搜索相同数量的结果? 1000? – vbNewbie 2010-05-20 18:56:14