我们目前只有英文的工作,我们需要阿拉伯语支持添加到它的SOLR构建没有太多详细的Solr维基有关如何使用Solr的索引和搜索阿拉伯文内容
启动这些都是下面的步骤香港专业教育学院做了
添加以下到schema.xml中
<fieldType name="text_general_arabic" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.ArabicNormalizationFilterFactory"/>
<filter class="solr.ArabicStemFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.ArabicNormalizationFilterFactory"/>
<filter class="solr.ArabicStemFilterFactory"/>
</analyzer>
</fieldType>
在定义字段Schema.xml的
<field name="البرتغالية" type="text_general_arabic" indexed="true" stored="true"/>
FYI IVE复制从谷歌的阿拉伯文字在浏览器中转换并粘贴它
后来我一直在使用记事本作为Unicode文件创建一个CSV文件并将其保存为Arabic.csv,它有它的字段名作为
البرتغالية
当我使用以下cURL命令
D:\>curl http://localhost:8080/solr/coll9/update/csv -F "stream.file=D:\Arabic.csv" -F "commit=true" -F "optimize=true"
-F "encapsulate="" -F "keepEmpty=true"
尝试索引文件
即时得到一个未定义场的错误,我不知道我在哪里做错了
更新:当我尝试用一个XML文件,而不是它是如此的第一个工作日
由于XML文件正在运行,您可以使用该方法而不是csv文件吗? –
不,我必须使用csv什么是错误的我的上述方法我甚至已启用我的Tomcat服务器上的UTF-8 – Mitra