我可以弹出一个网页,没有任何问题。我可以保存网页...作为HTML,没问题。我需要将网页保存为mht,以便我可以获取所有隐藏的html而不保存为mht。在研究中我完全没有提到如何使用python保存为mht。就像我上面说我可以尝试将其保存为一个文件MHT使用编码保存为HTML标准但根本不起作用......不要惊讶它也不起作用,但它是值得一试。Python中,保存为mht
url = 'https://www.thewebsite.com'
html = urllib.request.urlopen(url).read()
m = open('websitetest.mht', 'w')
m.write(str(html))
m.close()
我试图保存的网站在保存为mht时会遇到“隐藏代码”,但不会保存为html。因此为什么我试着让我得到的所有代码为mht保存,然后可以通过代码来拉断什么,我需要编译的数据库。
你有没有做过任何研究吗?似乎有几个工具可以做到这一点。 – jonrsharpe
通过查看这里计算器并键入“python的MHT文件”只取得了只是一对夫妇这还远远没有我是想做些什么结果的。 – confused
@jonrsharpe所以这些是什么工具? – user1712447