Oozie的协调配置是否有可能配置Oozie的协调,可以触发一个工作流程处理每一个组文件在这些条件下:多个文件扶养
集团是由我下的简单定义文件的集合父目录。 每个xx将一组文件加载到其对应的HDFS目录中。 每组文件都代表来自特定数据库的表格。 每组文件都包含在它们自己的父HDFS文件夹中,例如Database1,Database2。
文件名是每个父/组文件夹名称内的所有不同名称。 我想oozie做什么(即可能): 扫描该特定父目录中的所有文件都存在,每个文件名称将会不同,并且典型地以这些分隔文件所代表的表格命名。
如果所有文件都存在(从Oozie中定义的模板),然后我exexute工作流程。
如何配置oozie,我的猜测是,它可能不会灵活处理这个具体的请求,但我很想知道你们的想法。
我的双手在将文件夹/文件结构更改为HDFS方面存在联系。 我需要知道正确的问题才能问问负责生成传入文件的人。
任何洞察/经验,将不胜感激!