我需要创建一个包含所有图像和CSS的页面,所以它只会是一个文件。 我知道有像MHT(IE网络存档)的东西,但有问题。它仅适用于IE和Opera,不适用于FF。我需要我的网页在所有IE(6+),Opera和FF中工作。我知道有一种方法可以将我的图像编码为base64,我也知道,IE 6和7不支持数据URL。我见过Dean Edward's trick for IE 6 and 7,但它只适用于PHP
我想读和提取的XLS文件是真的单个文件网页上看到下面 This document is a Single File Web Page, also known as a Web Archive file.
我试图找出所有标记的含义,所以我可以保证我分析他们的数据正确使用lxml。 例如这里是一个标签的例子: <th class=3Dtl colspan=3D1 rowspan=3D2
虽然我