2013-05-05 44 views
1

我正在研究文本挖掘问题:从文本中提取位置。这个地方可能只是州或者更具体的例如芝加哥街区的名字,甚至是一个特定的地址。但它只在美国。从文本中挖掘位置

我一直在尝试雅虎Place Maker API,但我无法创建API密钥(网站没有响应)。无论如何,如快速矿工,还是写一个综合的正则表达式?

+2

正则表达式不会为此工作,看看这里:http://stackoverflow.com/questions/9397485/regex-street-address-match – 2013-05-05 22:55:17

回答

1

考虑斯坦福命名实体识别器(NER)。在线演示在这里:

http://nlp.stanford.edu:8080/ner/process

这是一个Java库。许可证是GPL v2,但在独立应用程序中分发的许可证价格昂贵。

+0

反正有没有使用rapidminer这个目的? – 2013-05-15 21:15:08

+1

有RapidMiner的信息抽取插件,但我已经尝试了几次,并没有真正理解它。 – 2013-05-15 21:31:28