2016-12-06 42 views
1

我可以弹出一个网页,没有任何问题。我可以保存网页...作为HTML,没问题。我需要将网页保存为mht,以便我可以获取所有隐藏的html而不保存为mht。在研究中我完全没有提到如何使用python保存为mht。就像我上面说我可以尝试将其保存为一个文件MHT使用编码保存为HTML标准但根本不起作用......不要惊讶它也不起作用,但它是值得一试。Python中,保存为mht

url = 'https://www.thewebsite.com' 
html = urllib.request.urlopen(url).read() 

m = open('websitetest.mht', 'w') 
m.write(str(html)) 
m.close() 

我试图保存的网站在保存为mht时会遇到“隐藏代码”,但不会保存为html。因此为什么我试着让我得到的所有代码为mht保存,然后可以通过代码来拉断什么,我需要编译的数据库。

+0

你有没有做过任何研究吗?似乎有几个工具可以做到这一点。 – jonrsharpe

+0

通过查看这里计算器并键入“python的MHT文件”只取得了只是一对夫妇这还远远没有我是想做些什么结果的。 – confused

+0

@jonrsharpe所以这些是什么工具? – user1712447

回答