2017-03-23 109 views
0

如何使用python语言中的urllib来保存包含网页内容的网页,以便它可以脱机查看?目前我使用下面的代码:如何使用python中的urllib下载网页(mhtml格式)

import urllib.request 

driver.webdriver.Chrome() 
driver.get("http://www.yahoo.com") 
urllib.request.urlretrieve("http://www.yahoo.com", C:\\Users\\karanjuneja\\Downloads\\kj\\yahoo.mhtml") 

这工作和strores文件夹中的网页的MHTML版本,但是当你打开文件,你只能找到代码编写的,它如何出现不是页面线上。我们是否需要更改代码? 另外,是否有另一种方式保存网页的MHTML格式与所有内容,因为它出现在网上,而不仅仅是源。任何建议? 感谢卡兰

+0

你要告诉你的操作系统,扩展名为'.mhtml'实际上是一个HTML文件的文件。 ('.mhtml'是HTML文件的一个不寻常的扩展。)或者,最好使用标准扩展名,例如'.htm'或'.html'。 – DyZ

回答

0

我想这个网站可以帮助你〜 Create an MHTML archive

+0

非常感谢,它确实帮助我,让事情变得简单 –

相关问题