2012-03-06 68 views
2

我有一个从HTML文件中提取信息的C#模块。但我的输入是一个MHT文件。我该如何去解压MHT文件的html部分?C#从MHT文件中提取HTML

+2

MHTML文件是_Mime HTML_文件。你需要一个Mime解析器/解码器。 [相关问题](http://stackoverflow.com/questions/3876406/basic-c-sharp-mime-decoding) – 2012-03-06 20:38:44

+0

感谢您指出我在正确的方向! – 2012-03-14 21:36:10

回答

1

我试过几个工具&据说这些库允许我提取MHT的内容,但几乎都失败了(我发现MHT文件的提供者没有正确地编码某些类型)。我最终发现了Total Commander,它让我解开MHT并提取html部分。这是一个黑客攻击,但它完成了工作。

似乎有很多创建MHT的工具,很少有用于解包它们的工具。