String original = "This is a sentence.Rajesh want to test the application for the word split.";
List matchList = new ArrayList();
Pattern regex = Pattern.compile(".{1,10}(?:\\s|$)", Pattern.DOTALL);
Matcher regexMatcher = regex.matcher(original);
while (regexMatcher.find()) {
matchList.add(regexMatcher.group());
}
System.out.println("Match List "+matchList);
我需要将文本解析为长度不超过10个字符的行数组,并且不应该在行尾有单词中断。将长字符串分解成适当的单词换行
我用下面的逻辑在我的情况却是后10个字符解析到最近的空白如果在对如线
的下场休息的问题:实际的一句话就是“这是一个句子。Rajesh想要测试分词这个词的应用。“但是在逻辑执行完成之后,它变得如下。
匹配列表[这是一个,nce.Rajesh,要,试,pplication,对,字,分]
假设你在Groovy想要这个?除了标签之外,您没有提及Groovy ... –
您的意思是第10个字符不应该是?如果它是一个空间呢? –
JHS
如果单词本身长度超过10个字符,会发生什么情况?它应该分裂在中间吗?例如,“quickbrownfoxjumpsoverthelazydog”变成“{”quickbrown“,”foxjumpsov“,”erthelazyd“,”og“}'? – dasblinkenlight