0
如何使用python语言中的urllib来保存包含网页内容的网页,以便它可以脱机查看?目前我使用下面的代码:如何使用python中的urllib下载网页(mhtml格式)
import urllib.request
driver.webdriver.Chrome()
driver.get("http://www.yahoo.com")
urllib.request.urlretrieve("http://www.yahoo.com", C:\\Users\\karanjuneja\\Downloads\\kj\\yahoo.mhtml")
这工作和strores文件夹中的网页的MHTML版本,但是当你打开文件,你只能找到代码编写的,它如何出现不是页面线上。我们是否需要更改代码? 另外,是否有另一种方式保存网页的MHTML格式与所有内容,因为它出现在网上,而不仅仅是源。任何建议? 感谢卡兰
你要告诉你的操作系统,扩展名为'.mhtml'实际上是一个HTML文件的文件。 ('.mhtml'是HTML文件的一个不寻常的扩展。)或者,最好使用标准扩展名,例如'.htm'或'.html'。 – DyZ