2012-09-24 17 views
1

我必须实现访问Web上的关联数据的Web Cralwer。我为此构建了一个简单的功能。我有三个查询:使用Jena Library的Java中的关联数据的Web爬虫

  1. 什么是我应该使用的种子URI。以RDF格式提供数据并遵循Tim Berners Lee的网站Linked Data principles ??
  2. 一般来说,对于Web-Cralwers,基于圆的方法意味着什么?我阅读了一般的网络爬虫,发现应该遵循基于循环的方法。
  3. 我只能解析可以返回RDF/XML数据的网页。是否足以抓取关联数据。

回答