apache-apex

    1热度

    3回答

    我需要将客户数据从几个内部数据库同步到云中。第二步,客户数据需要进行一些清理以删除(不同类型的)重复项。根据清理的数据,我需要做一些数据分析。 为了实现这一目标,我正在寻找一种可用于开放源代码的框架或云解决方案。我看了一下Apache Apex和Apache Kafka,但我不确定这些解决方案是否正确。 你能给我一个暗示你将用于这样一个任务的框架吗?

    4热度

    1回答

    由于两者都是一次处理事件的流式框架,这两种技术/流式框架之间的核心架构差异是什么? 另外,哪一个比另一个更合适?

    0热度

    2回答

    我一直在广泛搜索INTERNET,以便在Apache Apex中使用web-sphere MQ将MQ消息流式传输到DAG中。但是,似乎没有关于此事的IBM文档。 我知道它可能与ActiveMQ类似,我可能只需要传入Websphere Jars,但我不知道从哪里开始。 @Override public void populateDAG(DAG dag, Configuration conf

    1热度

    1回答

    我正在关注有助于创建启动项目的Apache Apex相关文档。 https://apex.apache.org/docs/apex-3.4/apex_development_setup/#creating-new-apex-project 在执行maven的命令, @echo off @rem Script for creating a new application setlocal mv

    3热度

    2回答

    有没有一种方法可以用来预测Apache Apex中两个不同运营商之间的N/W延迟。 在运营商将要使用的数据全部驻留在不同的机器上的情况下,这会增加运营商的延迟。 这是如何计算的?

    2热度

    1回答

    是否有可能增加输入操作员在运行的Apex应用不同的来源? 例如:在生产环境中,我运行的顶点程序读取来自输入源的文本文件,我想用它的输入操作相同的DAG添加卡夫卡源。

    2热度

    3回答

    顶点的所有实例中间使用说,DAG的第一家运营商应该是一个输入操作。这个操作符可以出现在DAG的中间位置。 考虑一个情况,我有数据要从数据库中提取,基于刚刚由前一个运算符处理的一些数据,这意味着输入运算符将位于DAG的某个位置中间。 根据一个输入操作者的定义是一个不具有任何输入流。但是,如果使用连接器,它也会执行获取数据的工作。那么,如果我在DAG之间的某个地方提取数据,它会起作用吗?

    2热度

    2回答

    我已经下载Apache Apex 3.5.0以及Malhar 3.5.0。 我已成功启动apex客户端,并将雅虎财务演示示例提交给我们的YARN集群(运行CDH 5.10)。群集正在运行并正确配置(许多Spark和MR作业正在运行)。 我看到我在YARN以及Apex cli中提交的作为RUNNING的应用程序。然而,当我尝试连接到应用程序主,我收到了404 org.apache.hadoop.ya

    2热度

    3回答

    是否有可能在没有DataTorrent RTS的情况下使用Apache Apex?看起来有可能,但我找不到任何有关安装apex源代码的任何教程(要运行,您需要以二进制形式输入apex)。我看到Apex CLI在生成./engine/src/main/scripts/apex之后可用,但是也许有一些更简单的方法比逐个构建它。

    2热度

    2回答

    如何使用Apache Apex创建批处理应用程序? 我发现的所有示例都是流式应用程序,这意味着它们不会结束,我希望我的应用程序在处理完所有数据后关闭它。 谢谢