我正在使用Tika从不同类型的文件中提取文本。所以我使用''AutoDetectParser``解析器,但它看起来像它的注册表是空的。我有以下代码,它返回一个空列表(第三和第四行)。如何在Tika中正确配置AutoDetectParser?
Parser parser = new AutoDetectParser();
ParseContext con = new ParseContext();
System.out.println(parser.getSupportedTypes(con)));
System.out.println(" parsers "+parser.getParsers());
我应该如何正确配置AutoDetectParser,它可以调用适当的解析器?
这通常是由于忘记在运行时类路径中包含'tika-parsers' jar以及依赖关系造成的。你是否完全确定*你的运行时类路径中存在这些jar并且可读? – Gagravarr
你有没有尝试检查你的安装具有哪些解析器?[详见Tika疑难解答指南](https://wiki.apache.org/tika/Troubleshooting%20Tika#Identifying_what_Parsers_your_Tika_install_supports),以及[识别失败的解析器按照故障排除指南加载](https://wiki.apache.org/tika/Troubleshooting%20Tika#Identifying_if_any_Parsers_failed_to_be_loaded)? – Gagravarr
谢谢。问题在于服务文件,他们错过了。 –