在寻找削减从解析的HTML非换空间之有道,我第一次无意中发现的String.trim()
Java的斯巴达定义,至少适当的记录。我想避免明确列出符合剪裁的字符,所以我认为在Character类上使用Unicode支持的方法会为我完成这项工作。为什么java不打破空格不是空白字符?
这时候我才发现,Character.isWhitespace(char)明确排除非中断空格是:
它是Unicode空格字符(
SPACE_SEPARATOR
,LINE_SEPARATOR
,或PARAGRAPH_SEPARATOR
),但不也是非打破空间('\u00A0'
,'\u2007'
,'\u202F'
)。
这是为什么?
corresponding .NET equivalent的执行较少歧视。
关于向后兼容性:我同意,但没有理由不添加,例如Character.isWhitespaceNew(char)来捕获当前的情况。 – Jirka 2012-10-15 18:42:47
那条路就是PHP。 – Eric 2012-11-20 18:32:56
另一条路就在于Java。一种为追随者(从错误中吸取经验教训)开辟道路的语言,但为什么有人会自愿使用它,如果他们有其他选择,则超出我的理解范围。 – Eloff 2013-05-10 14:17:38