2008-12-01 32 views
0

我正在寻找一种方法来获取网页的本质或最重要的方面?如果我提供一个URL,是否有任何外部服务可以实现这一点?我不在寻找像服务一样的snap.com,因为它提供了一个快照。有没有可以让我创建网页片段的服务

我可能愿意自己实施这样一个系统。开始的时候我不想付出太多的努力,而是希望能够得到一些基本的结果。对于我如何解决这个问题有什么想法吗?

+0

我认为你需要澄清你的意思是“页面最重要的方面”。 snap.com的替代品是http://browsershots.org/ – 2008-12-02 17:33:48

回答

0

通过snippet,你的意思是像一个报价,总结你想链接到整个页面?

所以如果snap.com不是一个幻想,整个页面呢?为了冗长?如果您想要缓存整个网站的缓存而不是其中一部分的快照,您可以尝试使用BackupURL

1

您可以尝试Yahoo's Term extraction service

更新02月 - 2012

雅虎发布新Content Analysis Web service将替代单词提取服务。它可以通过语法甜YQL如下图所示

select * from contentanalysis.analyze where url='http://www.cnn.com/2011/11/11/world/europe/greece-main/index.html'; 

还有AlchemyAPI它提供了一个weservice其可以用于你的目的被调用。

相关问题