我运行FAST ESP服务器上的搜索应用程序。现在我遇到了字符规范化的问题。FAST ESP字符规范化
我要的是寻找“伍尔特”并获得“伍尔特”一炮打响。
我试过配置在ESP以下的/ etc /标记者/ tokenization.xml
<normalizationlist name="German to Norwegian">
<normalization description="German u with diaeresis, to Norwegian u">
<input>x75</input>
<output>xFC</output>
<output>x75</output>
</normalization>
</normalizationlist>
但赛道,这把所有u到U,这是无用的。
如何配置的正确方法?
你不是指高级语言学指南? – darasd 2012-02-15 16:40:54