2014-01-09 74 views
0

我有一个URL,我怎样才能得到这个网站的描述(如谷歌返回的片段)在Java中。这可能与谷歌API或Bing API?如何获取网址的片段?

HttpClient给出了元数据,但我们无法获取网站的描述。

回答

0

通常该信息存储在<head>中的特殊元标记中。

<meta name="description" content="...Here goes the description your after..."> 

所以你想要做的是解析你的URL的内容寻找元数据标签。 (所以不需要使用API​​。)

而且一个如何解析和下载页面的例子可以在这里找到Parse Web Site HTML with JAVA

但是,如果您更愿意使用Bing API,则它将返回描述以及xml或json有效内容,根据http://www.bing.com/developers/s/apibasics.html

或者通过使用自定义搜索API并将c2coff属性设置为0来获取API https://developers.google.com/custom-search/docs/xml_results的更多信息。

+0

有关如何简单解析URL内容的任何详细信息? – Bill

+0

@Bill增加了一个链接到另一个问题,解释如何做到这一点:) –

+0

如果可以通过Google或Bing API,它会更适合我。 – Bill