2011-05-31 29 views
6

我使用试图基于索引的卷曲请求蒂卡Solr的集成

请求是

curl "http://localhost:8080/solr1/update/extract?literal.id=who.pdf&uprefix=attr_&fmap.content=attr_content&commit=true" -F "[email protected]/root/apache-solr-3.1.0/docs/who.pdf" 

在提交申请,我得到这个错误,

Error report</title><style><!--H1 {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;font-size:22px;} H2 {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;font-size:16px;} H3 {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;font-size:14px;} BODY {font-family:Tahoma,Arial,sans-serif;color:black;background-color:white;} B {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;} P {font-family:Tahoma,Arial,sans-serif;background:white;color:black;font-size:12px;}A {color : black;}A.name {color : black;}HR {color : #525D76;}--></style> </head><body><h1>HTTP Status 400 - ERROR:unknown field 'ignored_meta'</h1><HR size="1" noshade="noshade"><p><b>type</b> Status report</p><p><b>message</b> <u>ERROR:unknown field 'ignored_meta'</u></p><p><b>description</b> <u>The request sent by the client was syntactically incorrect (ERROR:unknown field 'ignored_meta').</u></p><HR size="1" noshade="noshade"><h3>Apache Tomcat/6.0.18</h3></body></html>r 

回答

13

你的问题是由于solrconfig.xml中定义的ExtractingRequestHandler的默认处理程序将所有Tika未标识的提取字段放入名为'ingored_XXXXX'的字段中。

为了解决这个问题,你可以简单地添加到您的Solr配置的字段名“ignored_ *”这样的:

<dynamicField name="ignored_*" type="ignored"/> 

不要忘了还加忽略的类型,如果你从默认删除配置:

<fieldtype name="ignored" stored="false" indexed="false" multiValued="true" class="solr.StrField" /> 

当Solr不知道Tika索引字段时,这将停止Solr崩溃。

+1

谢谢我做了同样的事情..我忘了把动态领域...它是完全一样的,你提到了...和好东西,现在我们得到非常好的结果与tika集成后..谢谢jens – 2011-06-28 17:07:51

+0

@naveengupta如果它有效,你应该接受它作为答案。 – kamaci 2013-04-24 19:43:27