2013-07-30 25 views
1

我试图通过flume来获取1TB左右的数据。为此,我尝试使用多路复用通道选择器。Fluiz使用多路复用通道选择器

有一些示例显示如何使用多路复用通道选择器。

我的问题是如何确定事件的标题内容?

例如,在以下结构中,我使用的与标头,如国家和映射复用信道选择器,以CN,ID,IN等制成

spoolDirAgent.sources.source1.selector.type = multiplexing 
spoolDirAgent.sources.source1.selector.header = State 
spoolDirAgent.sources.source1.selector.mapping.CN = channel1 
spoolDirAgent.sources.source1.selector.mapping.IN = channel2 
spoolDirAgent.sources.source1.selector.mapping.ID = channel2 
spoolDirAgent.sources.source1.selector.defalut = channel1 

此外,如果可能的话,请让我知道如何在水槽中使用事件头?

在此先感谢!

+0

另外,请让我知道我们如何检查事件标题是否包含作为状态的标题值? – Avinash

回答

0

如flume-ng用户指南所示,如果事件标题不包含关键字“状态”,则将使用默认的 通道。并在Flume-ng用户指南中搜索“静态拦截器”,或多或少地知道如何将“状态”键添加到标题中。

+0

我认为正则表达式提取拦截器比静态拦截器更合适。参见:http://stackoverflow.com/questions/19287766/how-to-use-regex-extractor-selector-and-multiplexing-interceptor-together-in-flu – frb