2013-08-16 22 views
0

我于Eclipse朱诺SR1和JRE 1.7.0_25Nutch的错误tika.TikaParser Eclipse的

解析步骤失败与此错误运行Nutch的2.2.1:

2013-08-15 19:35:26,555 ERROR tika.TikaParser - Can't retrieve Tika parser for mime-type application/pdf 
2013-08-15 19:35:26,557 WARN parse.ParseUtil - Unable to successfully parse content 

看起来这

Iterator<Parser> iterator = ServiceRegistry.lookupProviders(
    Parser.class, this.getClass().getClassLoader()); 

cygwin的版本相同的解析调用是成功的,我从服务注册表中的所有PARSERS:因为我得到一个空迭代误差由TikaConfig.java到来。所以,也许解决方案是与Service registry.

Nutch的-Eclipse进行Eclipse配置很好地配置有关的nutch-site.xml中,语法分析plugins.xml

我明白任何想法来解决这个问题。

+1

你有所有的蒂卡罐子,和他们的依赖条件正确的类路径? – Gagravarr

+0

是的,我拥有构建路径和顺序的所有依赖关系,也在VM参数上使用相同的cygwin类路径。同样的结果。 – Osy

回答