我有几个文本文件,有很多文本之间的换行,我想正常化,但没有模式例如达到文本之间的新行: Text
Some text
More text
More
more
所以我想改变其中换行的数量大于X到Y,所以我们可以说,当有5个连续的换行符时,它变成了2,10它变成了3. 我目前的问题是我不知道应该如何去确定哪条线将不得不正常化。 我知道我可以指望采用分体式的
我正在使用Ruby的StringScanner来标准化一些英文文本。 def normalize text
s = ''
ss = StringScanner.new text
while ! ss.eos? do
s += ' ' if ss.scan(/\s+/) # mutiple whitespace => single space