2008-10-18 127 views
4

有没有人有使用网络查询语言的经验?适用于网络的SQL

我正在寻找项目,商业或没有,做了一个很好的工作,使网页查询,甚至后面的链接来聚合从一堆页面的信息。

我会优先考虑sql或linq语法。我当然可以下载一个网页,并开始做一些XPATH,但我寻找一个有很好抽象的解决方案。

我发现的WebSQL

http://www.cs.utoronto.ca/~websql/

这看起来不错,但我不为Java

SELECT a.label 
FROM Anchor a SUCH THAT base = "http://www.SomeDoc.html" 
WHERE a.href CONTAINS ".ps.Z"; 

是否有其他人在那里?

是否有可用于.NET语言的库?

回答

0

我不确定这是不是你正在寻找,但Freebase是一个开放的数据库信息与程序化查询接口。

1

您可能在寻找SPARQL。它不允许您解析页面,但它旨在解决相同的问题(即从网站获取数据 - 从云端)。这是一个W3C标准,但很不幸,微软显然还不支持它。

3

参见hpricot(Ruby库)。

# load the RedHanded home page 
doc = Hpricot(open("http://redhanded.hobix.com/index.html")) 
# change the CSS class on links 
(doc/"span.entryPermalink").set("class", "newLinks") 
# remove the sidebar 
(doc/"#sidebar").remove 
# print the altered HTML 
puts doc 

它支持使用CSS或XPath选择器进行查询。

相关问题