2014-01-10 28 views
-3

我需要保存一个网页。使用机械化,我可以保存根页面的HTML。但是,在加载页面后会运行许多脚本,并使用我希望保存到文件的数据填充页面的多个部分。编程保存网页所有加载脚本运行后

我很确定我已经看到有一个图书馆存在这个,但我不记得名字,也没有找到它在我的无数的搜索。我想我看到有一个库像Web浏览器一样运行,允许它加载页面,运行需要运行的任何JS脚本,然后返回最终页面,就像在真实的浏览器中显示的一样。

我不确定它是Python 2还是3,但两者都可以工作。

回答

0

我想我找到了我正在寻找的东西。 Selenium!它在Python中也有一个package。如果这确实是我正在寻找的内容,请更新此答案和社区可搜索性问题。

+0

FWIW请参阅[praveen](http://stackoverflow.com/a/21037397/1007939)的答案。正是我发现的,也许是我记得的回答 – CDspace