2015-10-16 58 views
0

我在downloadig URL中遇到问题。在没有urllib的情况下在Python中下载URL

我需要下载带表格的网页。当我在urlliburllib2的帮助下获得.html文件时,它有一些与javascript(或相同语言)相关的问题。只有源代码,如id_name e.t.c,但它没有任何表信息(列和行)。然而,当我在Google Chrome中保存.html时,它实际上具有表格中的信息(不是源代码,而是列和行)。那么我应该怎么做才能在Python中实现呢?

+3

它可能会被javascript填充 – DreadfulWeather

+1

正如@DreadfulWeather所说,页面可以使用异步查询来填充内容,所以你可以使用浏览器的调试器来检查网络查询。一旦找到包含内容的查询,就可以使用该查询的URL通过urllib下载 –

回答

2

您可以使用selenium来模拟浏览器。它会执行javascript然后你可以得到你想要的信息

相关问题