2011-04-22 124 views
0

我需要使用C#将PDF文件转换为.doc文件。虽然没有安装Office,但计算机没有文件系统。任何好的想法,我可以如何处理这个?我做了一些研究,大多数人使用互操作服务。如何在没有microsoft.office.interop的情况下将PDF转换为doc?

+0

究竟你“的电脑有没有文件系统”,因为声明没有任何意义意味着什么CONVER PDF格式文本,然后文本文档。老实说,最好的办法是办公室互操作。 – 2011-04-22 18:37:47

+0

可能没有安装Windows操作系统? – 2011-04-22 18:38:44

+0

那么,计算机几乎只是strems ...此外,我需要将PDF转换为PNG和DOC到PNG ...我不知道如何做到这一点没有interop – 2011-04-22 18:47:46

回答

0

您需要了解PDF并非真正实现为单一文档格式。

如果您的PDF文档是通过将文本呈现为PDF文件创建的,那么直接的PDF转换不仅可以,而且可以非常好(可靠)。

如果您的PDF文件的来源是扫描仪或传真(实质上是扫描仪...),那么您拥有的是带有“图片”文本的文档。这种情况更难以处理。如果您为此打开标记,则不会转换“文本”。在这种情况下,您必须处理某种OCR(光学字符识别)方式,由于各种问题而不太可靠。

如果您可以在数据呈现为PDF之前截取数据(比如在SSRS或Crystal中),那么绕过PDF阶段并将数据移动到Word文档会更好。

如果您受限于接收传真然后需要解释其内容,请准备OCR地狱。我在那里已经有一段时间了,所以我希望它变得更好。

即使您的计算机上安装了外出办公室,您也可以访问(通过Visual Studios)Office开发人员工具包,这将允许您构建以Word格式(。doc/.docx)分发的文档。

0

一个选项/想法可能是将PDF转换为Html,它可以在Word中打开?

0

使用的Aspose PDF套件使用FILESTREAM或阅读Aspose文档

相关问题