Recentrly删除口音,我发现非常有用的方法StringUtils的图书馆是从字符串
StringUtils.stripAccents(String s)
我发现它真的有用以消除任何特殊字符并将其转换为一些ASCII“等价物”,对于instace C = C等
现在我正在为德国客户谁真的需要做这样的事情,但只为非德语字符工作。任何变音都应该保持不变。我意识到在这种情况下,弦乐器不会有用。
有没有人有这方面的经验? 是否有任何有用的工具/库/类或正则表达式? 我试着写一些类,这是分析和更换等字符,但它可以建立这样的地图所有的语言非常困难......
任何建议appriciated ...
它似乎有检测所使用的语言的功能。你能澄清这将如何帮助? – eis
你可以有原始字符串作为输入,把语言检测到德国,然后将检测到德国的字符,并丢弃剩余 –