2011-08-15 205 views
1

我想在我的solr中实现阿拉伯语搜索,我能够索引文档但无法搜索它们。当我通过ID参考文件我得到的文件,而不是当我用阿拉伯语词的搜索,Solr阿拉伯语搜索

搜索URL

http://122.166.9.144:8080/solr/tw/select/?q=تأجير الاهلي 

搜索响应

<response> 
<lst name="responseHeader"> 
    <int name="status">0</int> 
    <int name="QTime">18</int> 
    <lst name="params"> 
     <str name="q">تأجÙر اÙاÙÙÙ</str> 
    </lst> 
</lst> 
<result name="response" numFound="0" start="0"/> 
</response> 

可能是什么问题呢?

感谢,

罗希特

编辑请求/响应头

Response Headers view source 
Server Apache-Coyote/1.1 
Content-Type application/xml;charset=UTF-8 
Transfer-Encoding chunked 
Date Mon, 15 Aug 2011 15:37:25 GMT 

Request Headers view source 
Host 122.166.9.144:8080 
User-Agent Mozilla/5.0 (Windows NT 6.0; rv:5.0) Gecko/20100101 Firefox/5.0 
Accept text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 
Accept-Language en-us,en;q=0.5 
Accept-Encoding gzip, deflate 
Accept-Charset ISO-8859-1,utf-8;q=0.7,*;q=0.7 
Connection keep-alive 
+0

好点,谢谢:) – Tarek

回答

1

显然,服务器无法使用正确的字符集在URL中的阿拉伯文字解码。它看起来似乎有点像UTF-8,但认为它是Latin-1。您是否尝试过使用wiresharking对话来查看哪些URL字节被发送到服务器?

+0

我已经更新了请求/响应标题.. q似乎很好。 – sesmic

+0

您显示的内容不是网络语法,也不包括网络上传输的(希望百分比编码的)请求URL。 –

+0

感谢Henning的建议..实际上编码没有在服务器级别(tomcat)上正确设置。 – sesmic