我有一些文本,即时尝试解析文件。检测文本解析是否为句子或编号列表
考虑这个文本文件:
Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.
Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do
eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.
1. Line 1
2. Line 2
+ Line 1
+ Line 2
+ Line 3
有三段在文本文件中。
首先是一对句子。 第二个人有一个句子和一个编号列表。 三是一个简单的项目符号列表。我的问题是,在Objective-C中,我怎样才能弄清楚段落组合,如果它只是句子,我会将它们作为NSString返回,如果它的项目符号列表,我希望它们在NSArray中分开,如果段落是句子和编号列表的组合,我将它们作为NSString和NSArray的字典返回。
任何想法?我知道我可以使用正则表达式来出来分成数组或字符串,但我不太知道如何检测并验证是否对位是:
- 第(句子)
- 子弹名单/编号列表。
- 组合列表和帕拉
我已经读了一堆教程和关于regexpressions SO问题后尝试这样做。
此表达(?=\d*\s*[\.]?\s*)([a-z\s]+)
确实获取编号列表,但它也抓住列表之前的前面的文本。那就是我完全陷入困境的地方。
你确实写人 – jasonIM