我有一个过滤器关键字列表(大约1000个数字),我需要使用这个列表过滤一个关系领域的猪。猪过滤器匹配过多
最初,我宣布这些关键字如: %declare p1'。 keyword1。'; .... ...
%declare p1000'。 keyword1000。';
然后我做过滤,如:
过滤= FITLER SRC BY(未$ 0匹配 '$ P1')和(非$ 0匹配 '$ P2')和......(不是$ 0匹配'$ P1000');
DUMP过滤;
假设我的源关系在SRC中,我需要对第一个字段应用过滤,即$ 0。
如果我将过滤器的数量减少到100-200,它工作正常。但是,随着过滤器数量增加到1000个。它不起作用。
有人可以提出一个解决方法来获得正确的结果吗?
在此先感谢
你能给我轻微的概述,我应如何在驱动程序中猪脚本链接我的用户定义的函数。 – 2012-05-02 05:22:30
查看文档中的REGISTER和DEFINE函数http://pig.apache.org/docs/r0.9.2/basic.html#register – 2012-05-02 06:53:16