2011-02-02 164 views
0

我想将任何html网站上的数据转换为rdf。 你知道任何html到rdf转换器吗?或者,您为此目的推荐使用XQuery或GRDDL吗?将HTML/XML网站转换为RDF

+0

这叫做“语义标记”吗?我认为没有可用的自动工具。我知道一个名为SMORE的工具(在Liyang Yu的“语义Web和语义Web服务介绍”中介绍过)。试试 :) – Songokute 2013-05-10 06:01:54

回答

4

一般来说,自动转换是不可能的,因为HTML表示的是什么东西看起来像,而不是它的意思。如果HTML包含现有标记,则可以使用Anything2Triples(http://developers.any23.org/)来获取RDF。

如果它只是HTML,你必须以某种方式编写自己的提取规则。 GRDDL可以工作,但我可能会简单地使用python + BeautifulSoup。这取决于你已经知道的技术/语言!

0

如果HTML包含嵌入的RDFa,则可以使用RDFa解析器来提取信息。有可用于各种平台和语言的解析器取决于您的开发环境。