我想知道是否有任何现有的库或从Objective-C访问,可以让我刮格式化像this one。具体而言,每个日期旁边的所有日期和所有文本。如果没有,那么最好的方法是什么呢?常用表达?我听说NSString
可能已经有内置的方法。这是真的?刮和解析维基百科页面
我正在四处寻找,看看是否有其他替代方法,如XML文件或API。我确实找到了一个API,但我看到的唯一客户端是使用其他语言的,他们似乎只能将内容发布到页面,而不是检索它。
编辑:所以我发现关于这些链接的API的更多信息:
,我能够拿出this request返回一些HTML编码的文本(格式是XML,但它包括页面的文本,如»a href=
等我会继续浏览文档,看看我能不能如果不是这样,这会更好一些,有没有解析这个的建议?
编辑2:好吧,所以拜this doc page,我已经能够检索数据最简单和干净的方法是使用这个constructed link返回原始数据(在维基标记)的相关部分的。但是,我想我需要解析一下,但如果真的如此,它应该比整篇文章容易得多。
有没有人有任何解析wiki标记的建议,如Objective-C中的以下内容?
==Events==
* [[710]] – [[Saracen]] invasion of [[Sardinia]].
*[[1275]] – Traditional founding of the city of [[Amsterdam]].
*[[1682]] – [[Philadelphia]], [[Pennsylvania]] is founded.
我想最终拥有的是什么,我想一个NSDictionary
或类似的集合,将日期存储与信息伴随片断。谢谢!
谢谢你,我欣赏它。我认为我要走的路(我能看到这样做的唯一途径)是获取原始数据,然后以某种方式解析它。我已经包含了上述数据的一个例子,但我很可能会为此创建一个新问题。 – 2009-10-27 21:49:17
新数据更容易解析 - 我会通过查找在事件之后开始的字符串范围来处理该数据,然后对括号内的纯数字进行匹配,以及ndash之后的任何内容直到行尾。那么你只需要去除所有的“[”和“]”字符,你就会全部设置好。虽然超级链接很重,但比HTML更容易处理。 – 2009-10-28 01:27:38
谢谢,你是否介意回答我关于解析的后续问题? http://stackoverflow.com/questions/1634012/how-to-parse-some-wiki-markup谢谢! – 2009-10-29 15:47:17