2013-11-27 93 views
0

我正在接收mht文件。我需要从这个文件中提取文本并继续使用一些buisness逻辑。将mht转换为html

有没有一种方法来提取MHT文件中的文本?

有没有办法转换的MHT到HTML吗?

+0

不是这些这个问题:http://stackoverflow.com/questions/16203002/how-can-you-programmatically-or-with-a-tool-convert-mht-mhtml-files-to-regula – Willmore

回答

0

由于MHTML基本上包含原始的HTML文件及其所有资源的MIME文件,您可以使用MIME库中提取的不同部分。请注意,mht文件内的html文件中的所有引用都可能引用嵌入文件的原始位置,您需要从MIME部件的Content-Location标头中重新构建这些引用。