2012-11-11 51 views
0

我在解析RSS提要,寻找对国家的引用。目前我正在使用Python,但我认为这个问题相当语言不可知(理论上)。用于查询的数据存储

比方说,我有三个列表(所有相关的)

  • 国家 - 名词(即英格兰,挪威,法国)
  • 国家 - 形容词(即英语,挪威语,法语)
  • 城市(即伦敦,纽卡斯尔,伯明翰)

我的目标是从解析这些字符串的提要开始。

因此,举例来说,如果“伦敦”中发现,该国将成为“英格兰”,如果“挪威”,发现这将是“挪威等

什么将是这个工作的最佳方法数据?它会不会是杰森,并将其全部用于创建嵌套字典?套?或某种类型的数据库?

目前这只适用于本地机器。

回答

0

这是一个非常值得商榷的问题。可以有多种解决方案。如果我是你,我只想在MongoDB中一个小DB三和用表像这些

  1. 国家: 列:ID,名称
  2. 国家-ADJ: 列:ID,姓名,COUNTRY_ID
  3. 城市: 列:id,name,country_id

然后简单的查询会给你想要的结果。

0

我建议将3个数据列表合并到一个字典中,该字典将名称映射到国家名称,例如,它映射"England" -> "England""English" -> "England""London" -> "England"。它可以很容易地存储在数据库或文件中并进行检索。

然后我会搜索词典中的键,并用词典中的值标记项目。