2011-04-15 44 views
0

我使用露天ECM使用老虎OCR库()露天ECM内容转换

我的自定义转换XML(OCR变压器上下文)是

<?xml version='1.0' encoding='UTF-8'?> 
<!DOCTYPE beans PUBLIC '-//SPRING//DTD BEAN//EN' 'http://www.springframework.org/dtd/spring-beans.dtd'> 

<beans> 

    <bean id="transformer.Ocr.Tiff2Pdf" class="org.alfresco.repo.content.transform.RuntimeExecutableContentTransformerWorker"> 
     <property name="checkCommand"> 
     <bean class="org.alfresco.util.exec.RuntimeExec"> 
      <property name="commandsAndArguments"> 
       <map> 
        <entry key=".*"> 
        <list> 
         <value>c:\ocr\ocr.exe</value> 
         <value>--about</value> 
        </list> 
        </entry> 
       </map> 
      </property> 

     </bean> 
     </property> 
     <property name="transformCommand"> 
     <bean class="org.alfresco.util.exec.RuntimeExec"> 
      <property name="commandsAndArguments"> 
       <map> 
        <entry key="Windows.*"> 
        <list> 
         <value>c:\ocr\ocr.exe</value> 
         <value>--replace</value> 
         <value>--replace</value> 
         <value>--language en</value> 
         <value>--pdf</value> 
         <value>--output-file</value> 
         <value>${target}</value> 
         <value>${source}</value> 
        </list>      
        </entry> 
       </map> 
      </property> 

     </bean> 
     </property> 
     <property name="explicitTransformations"> 
     <list> 
      <bean class="org.alfresco.repo.content.transform.ExplictTransformationDetails" > 
       <property name="sourceMimetype"><value>image/tiff</value></property> 
       <property name="targetMimetype"><value>application/pdf</value></property> 
      </bean> 
      <bean class="org.alfresco.repo.content.transform.ExplictTransformationDetails" > 
       <property name="sourceMimetype"><value>image/tiff</value></property> 
       <property name="targetMimetype"><value>text/plain</value></property> 
      </bean>   
     </list> 
     </property> 
    </bean> 
</beans> 

转换TIFF为PDF当我将TIFF文件导入公司主文件夹我现在期望将内容转换为PDF。现在我正确地假设转换是自动的还是需要在空间上调用规则?

而且,我已经设置了日志记录了改造DEBUG,这是我在露天日志中看到

DEBUG [util.exec.RuntimeExec] 执行结果:操作系统:
的Windows XP命令:
[C:\ OCR \ ocr.exe,--about]
成功:真退出代码:0
出:Intelliant OCR命令行实用程序 ,版本1.1.0。版权所有© 2006年

现金

TIFF库版权所有(C)1988-1997 山姆莱弗勒版权所有(C)1991-1997 Silicon Graphics公司

独立JPEG小组库
Copyright(C)1991-19 User:admin DEBUG [content.transform.ContentTransformerRegistry] 搜索变压器:源 mimetype:image/tiff target mimetype:text/plain变形金刚: []

好像它搜索文本/纯文本的目标,当我真的需要它转换为PDF。我在这里错过了什么?请帮助

回答

1

将自动运行的唯一转换是纯文本文本,用于全文索引。

如果您使用共享,那么Share会尝试为您再做两次转换。首先,当你用文件查看文件夹时,它会尝试生成缩略图(通过再现服务)。为了达到这个目的,你通常需要定义一个从新的MIME类型到image/jpeg的转换器。此外,当您在共享中查看文档详细信息时,它会尝试为您提供网络预览。

如果您希望在上传文档时生成PDF文档,那么您需要定义规则。你可以用变换内容规则来做到这一点,或者你可以编写一个脚本来使用Rendition服务,如果你想对它进行很多的控制。