2013-04-25 49 views
0

我想加入GeoIP数据库的日志条目。这是我的。MapReduce内部加入?

  1. 在我的日志文件中,我将IP地址(外键)提取为键。并将其作为一个值休息。

  2. 在GeoIP数据库中我有一个IP地图范围到特定的国家(IPFROM,IPTO,国家)。

现在我不确定如何去加入这两个字段,以及要使用哪个连接。

回答

1

如果我理解正确,你想得到一个给定的IP地址日志文件的国家名称。

您可以通过导出数据库表来创建一些csv。

然后您可以使用分布式缓存概念来读取该文件

+0

同意这一点。但那么如何将国家与IP映射为GeoIP拥有一系列IP地图到一个国家? – Ananda 2013-04-25 06:17:22

+0

请从日志文件 – 2013-04-25 11:27:28

+0

发布数据库的一个样本记录和一个样本行是固定长度的ip范围吗? – 2013-04-25 12:31:42