我使用preg_split()
从字符串得到句子的阵列。使preg_split()问题包含字符串“和”
$sentences = preg_split("/([.?!\r\n]+)/", $text, 0, PREG_SPLIT_NO_EMPTY|PREG_SPLIT_DELIM_CAPTURE);
但当$text
包含 '&',例如:
$text = 'this is test. we are testing this & we are over.';
那么它停止 '&' 后匹配。
你能否澄清 “这个我们停止后&”?它停止解析字符串还是它在&符号(&)处分裂或者什么? – Compeek 2011-04-22 21:07:43
我会更新你的正则表达式来捕捉更多的句子类型,而不是下降了'.'。 '([^。?!] +(= [ '“] \ s *)(?:?!] ['?”[。?!]] \ s *))'为我工作,但我可能错过了其他模糊的类型的句子结尾/开始。得到比赛后(不分裂),运行修剪摆脱空间。 – 2011-04-22 21:33:09