2017-05-25 30 views
0

PDF文件夹中有多个不同名称的PDF文件。如何迭代文件夹中的所有pdf文件以使用apache tika进行数据提取

<dataSource type="BinFileDataSource" name="data"/> 
     <dataSource type="URLDataSource" baseUrl="${solr.install.dir}/example/exampledocs/PDF" name="main"/> 

如何迭代所有这些文件并以文档名作为关键字对每个文档内容进行索引。

+0

在https://stackoverflow.com/questions/10252822/indexing-all-documents-in-doc-folder-in-to-solr-filelistentityprocessor中找到答案 – KS6

回答

相关问题