我正在研究文本挖掘问题:从文本中提取位置。这个地方可能只是州或者更具体的例如芝加哥街区的名字,甚至是一个特定的地址。但它只在美国。从文本中挖掘位置
我一直在尝试雅虎Place Maker API,但我无法创建API密钥(网站没有响应)。无论如何,如快速矿工,还是写一个综合的正则表达式?
我正在研究文本挖掘问题:从文本中提取位置。这个地方可能只是州或者更具体的例如芝加哥街区的名字,甚至是一个特定的地址。但它只在美国。从文本中挖掘位置
我一直在尝试雅虎Place Maker API,但我无法创建API密钥(网站没有响应)。无论如何,如快速矿工,还是写一个综合的正则表达式?
考虑斯坦福命名实体识别器(NER)。在线演示在这里:
http://nlp.stanford.edu:8080/ner/process
这是一个Java库。许可证是GPL v2,但在独立应用程序中分发的许可证价格昂贵。
反正有没有使用rapidminer这个目的? – 2013-05-15 21:15:08
有RapidMiner的信息抽取插件,但我已经尝试了几次,并没有真正理解它。 – 2013-05-15 21:31:28
正则表达式不会为此工作,看看这里:http://stackoverflow.com/questions/9397485/regex-street-address-match – 2013-05-05 22:55:17