1
我添加PDF文档到Solr如何在Solr中查询PDF?
curl "http://localhost:8983/solr/update/extract?literal.id=doc2&captureAttr=true&defaultField=text&fmap.div=foo_t&capture=div" -F "[email protected]"
,我想它查询单词 “错误”
http://localhost:8983/solr/select/?q=errors&version=2.2&start=0&rows=10&indent=on
我没有得到任何结果。
但是,如果我查询它的单词“java”,我会得到一个页面(添加的PDF文本),并在可见文本中有词“错误”。
P.S.我是Lucene和Solr的新成员,我不明白为什么不能在该pdf中搜索每个单词。
尝试extractOnly = true查看Solr从PDF中提取的内容。 – 2010-07-11 21:36:32