我目前运行到麻烦,我认为将是一个简单的任务。将字符串分割成句子了常用标点符号
如果我有这样的字符串:
句子1“双引号的短语”句子1.句子2?第3句(括号中的数字不应该被拆分)。句子4'单引号短语。剩下的引用'句子4.句子5!
我想把它分成:
句子1“双引号的短语”句子1.
句2?
句3(数字像1.2括号不应被分割)。
句子4'单引号的短语。报价休息”一句4.
5句!
显然,一个简单的"\.|\?|!"
比赛将无法正常工作。任何帮助表示赞赏。
我认识的正则表达式可能不是我们的最佳工具,但除非有我失踪另一个快速简单的解决办法,我过去的不归路。
什么是工具/语言? – nhahtdh 2013-03-09 21:26:32
@使用正则表达式的PHP。 – Phil 2013-03-09 21:30:41
@Phil只要你的语言支持正则表达式替换,你可以将sed行翻译成你的语言。但请阅读我答案中的其他评论。 – Kent 2013-03-09 21:38:16