2012-05-06 153 views
1

我想要从网页中的表格获取数据,这似乎是使用“Excel发布为网页向导”发布的。我知道有很多抓取工具(看起来对于这样的任务很先进),并且知道我可以编写一个脚本,但是我想指出一些非常简单的事情,特别是数据是使用自动发布的工具。网络数据提取,从表格获取数据到CSV

我更喜欢有导轨解决方案。

该数据为统计健康数据,here are links to some samples

回答

0

是的,结构非常简单。在你的地方,我只会使用你认识的任何语言,而不会花时间学习第三方刮板。就我个人而言,我使用C#来完成这些任务。

+0

确实,我打算使用导轨,还有一个叫做open-uri的漂亮宝石,里面有一个关于使用它的漂亮博客: http://www.igvita.com/2007/02/04/ruby-screen- 60秒/0.刮板,但我认为这种常见的数据结构会准备好使用。 也许我应该问stat.exchange,非常感谢。 – Bahax