2014-02-21 76 views
0

我现在正在积极研究前端开发,为了更好地保留材料,我在Anki中创建了闪存卡。如何从this page表中自动提取数据并将其保存为“问题(属性)---答案(描述)”的格式?如何从其他网站自动提取表格的内容?

+0

你想把它保存到数据库吗?什么是最终目标? –

+0

最终目标是将此数据粘贴到Anki(间隔重复软件)中,并填入“Math.ceil()所做的事情”等。 –

+0

您对该网站的许可是否受到许可?如果你要偷的话不要偷从许多人认为是互联网上最危险的无用资源 – 2014-02-21 03:09:52

回答

1

由于same origin policy,您将不得不使用Javascript下载HTML。您可以运行本地托管服务器,下载并解析HTML,然后通过JSON或XML将数据发送到浏览器并在此时显示。

+0

谢谢!大声笑我应该猜到了。 –

0

同意@Cameron Askew。您可以使用服务器端语言,如:php,java或nodejs来获取html文档并使用正则表达式进行分析,然后在客户端使用ajax来获取它。

+0

用正则表达式解析HTML! [AHHHH](http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags)。大声笑,这是一个有趣的阅读,如果你还没有阅读。但是,使用正则表达式解析一个简单的表是pbb好,但我喜欢XML解析器,让我的生活更轻松我想! –

+0

你说得对,正则表达式不是最好的方法。解析像javascript dom这样的html将是一个更好的方法。 Thx提醒我〜。 :) –