0

我需要每隔几个小时备份6个DynamoDB表。我从模板创建了6个管道,并且它运行得非常好,只是它创建了6个或更多的虚拟机,这些虚拟机大部分都处于运行状态。这不是我能负担得起的经济。在DynamoDB表备份期间限制AWS数据管道使用的EC2资源

有没有人有过优化这种场景的经验?

+0

您需要使用以下Rohit建议的第三个选项。在同一个EMR集群上运行多个活动的单个管道。然后您可以控制整个群集的大小进行调整。 – panther

回答

0

浮现在脑海中的一些解决方案是:

一: 为了确保EC2资源被终止,可以设置在EC2资源定义的terminateAfter财产。这里讨论终止之后的语义 - How does AWS Data Pipeline run an EC2 instance?

两个: This thread在AWS论坛上讨论了数据管道如何使用现有的EC2实例。

三: 使用备份管道模板始终创建一个单一管道,其中单个Activity用于从单个源读取并写入单个目标的备份。您可以在AWS控制台中查看管道的JSON源,并使用多个活动实例编写一个类似的管道,其中一个用于要备份的每个表。由于管道定义只有一个EMR资源,因此只有该EMR资源才能完成所有活动的工作。