我需要保存一个网页。使用机械化,我可以保存根页面的HTML。但是,在加载页面后会运行许多脚本,并使用我希望保存到文件的数据填充页面的多个部分。编程保存网页所有加载脚本运行后
我很确定我已经看到有一个图书馆存在这个,但我不记得名字,也没有找到它在我的无数的搜索。我想我看到有一个库像Web浏览器一样运行,允许它加载页面,运行需要运行的任何JS脚本,然后返回最终页面,就像在真实的浏览器中显示的一样。
我不确定它是Python 2还是3,但两者都可以工作。
我需要保存一个网页。使用机械化,我可以保存根页面的HTML。但是,在加载页面后会运行许多脚本,并使用我希望保存到文件的数据填充页面的多个部分。编程保存网页所有加载脚本运行后
我很确定我已经看到有一个图书馆存在这个,但我不记得名字,也没有找到它在我的无数的搜索。我想我看到有一个库像Web浏览器一样运行,允许它加载页面,运行需要运行的任何JS脚本,然后返回最终页面,就像在真实的浏览器中显示的一样。
我不确定它是Python 2还是3,但两者都可以工作。
该库是selenium。 http://www.youtube.com/watch?v=g54xYVMojos是一段时间我看到硒在行动中的视频。请参阅我的回答How to load all entries in an infinite scroll at once to parse the HTML in python查看硒的样本用法
+1我尝试了更多的搜索,并发现了确切的,但未经测试尚未确认。我会给你答案,并感谢你的确认。 Grats! – CDspace