我期待从文本例子很短的突发中提取人名和地名我应该使用LingPipe还是NLTK来提取姓名和地点?
"cardinals vs jays in toronto" " Daniel Nestor and Nenad Zimonjic play Jonas Bjorkman w/ Kevin Ullyett, paris time to be announced" "jenson button - pole position, brawn-mercedes - monaco".
目前这个数据是在MySQL数据库中,和我(非常)有一个单独的记录每一个运动员,虽然名字有时拼写错误等。
我想提取运动员和位置。 我通常使用PHP工作,但一直未能找到实体提取库(我可能想在将来更深入一些NLP和ML)。
从我所发现的,LingPipe和NLTK似乎是最推荐的,但我不明白是否要么真的适合我的目的,要么别的什么会更好。
我还没有用Java或Python进行编程,所以在我开始学习新语言之前,我希望得到一些关于我应该遵循什么路线或其他建议的建议。
“......每个运动员都有一张单独的桌子......”或许你的意思是每个运动员都有一个_record_? (这将是一个可怕的很多表,否则...) – mjv 2009-10-31 23:10:51
是啊!如果我为每个运动员分配一张桌子,语言/模块将成为我的问题中最小的问题!感谢您指出了这一点。 – pedalpete 2009-10-31 23:32:25