2010-07-11 40 views
1

我添加PDF文档到Solr如何在Solr中查询PDF?

curl "http://localhost:8983/solr/update/extract?literal.id=doc2&captureAttr=true&defaultField=text&fmap.div=foo_t&capture=div" -F "[email protected]" 

,我想它查询单词 “错误”

http://localhost:8983/solr/select/?q=errors&version=2.2&start=0&rows=10&indent=on

我没有得到任何结果。

但是,如果我查询它的单词“java”,我会得到一个页面(添加的PDF文本),并在可见文本中有词“错误”。

P.S.我是Lucene和Solr的新成员,我不明白为什么不能在该pdf中搜索每个单词。

+1

尝试extractOnly = true查看Solr从PDF中提取的内容。 – 2010-07-11 21:36:32

回答

2

看看这个类似的问题和answer

尝试使用分析,看看哪些字插入索引。