我们在RDS中有几个mySql表,这些表很大(超过700 GB),我们希望迁移到DynamoDB表。你能提出一个策略,或者以一种干净的,并行的方式来做到这一点?也许使用EMR或AWS Data Pipeline。需要将大型表从RDS迁移到DynamoDB的策略建议
回答
您可以使用AWS Pipeline。有两个基本模板,一个用于将RDS表移至S3,另一个用于将数据从S3导入DynamoDB。您可以使用这两个模板创建自己的管道。
问候
有一点要考虑这样的大数据是迪纳摩是否是最佳的选择。
如果这是统计数据或其他“大数据”,请查看AWS RedShift,它可能更适合您的情况。
我们需要切换到非规格化的无模式表以适应某些用例,因此对于我们来说,Dynamo是更好的选择。 –
@AnkitKapur - 如果你可以为你的数据选择一个好的散列键,那么Dynamo是唯一不错的选择!请阅读文档,并确保您了解Dynamo的限制和最佳做法,然后再使用该路线。 –
我们已经做了类似的工作,可能有更好的策略来做到这一点。在源实例中使用AWS DMS和一些准备表。
它涉及到两个步骤:
你建立一个源代码实例中新表与dynamodb的模式匹配,到底是哪。如将多个表合并为一个等。
设置DMS任务,准备表作为源,DynamoDB作为目标。由于准备表和目标模式现在相匹配,所以从这一点来看,它应该是非常简单的。
希望帮助!祝你好运!!
- 1. 传统应用程序迁移策略 - 策略需要的建议
- 2. Django缓存策略需要的建议
- 3. 从oracle迁移到cassandra需要考虑什么策略
- 4. 需要一些关于从Motif迁移到Gtk的建议
- 5. 从SQL 2000迁移到SQL 2008的迁移策略
- 6. 大型MySQL表 - 需要建议
- 7. rails数据和模型迁移策略
- 8. 迁移到团队系统的策略
- 9. Struts1到Struts2的迁移策略
- 10. 将大型SQL表迁移到SQL azure
- 11. 从Veracity迁移的建议?
- 12. 我需要大型网站的建议
- 13. 将分支策略从ClearCase迁移到TFS 2010
- 14. 那就需要花多少时间将数据从DynamoDB迁移到S3
- 15. 在大型表上运行ALTER迁移的建议
- 16. NonUniqueObjectException迁移到hilo生成器策略
- 17. 学说2继承映射策略需要的建议
- 18. 需要关于发布管理策略的建议或指导
- 19. 将数据从电子表格迁移到RDBMS的策略是什么?
- 20. DynamoDB主键策略
- 21. 多人UDP网络策略,需要建议
- 22. 使用Javascript - 策略模式建议需要
- 23. 将postgres转储迁移到RDS
- 24. 迁移到Amazon SQL Server RDS
- 25. 我们可以将Teradata迁移到DynamoDB
- 26. 从MVC2迁移到MVC3 /剃须刀的策略
- 27. 在SAP上下文中从php迁移到java的策略
- 28. 从ClearCase迁移到SVN的最佳策略是什么?
- 29. 从Amazon RDS(MySql)迁移到Heroku Postgres需要付出多少努力?
- 30. VB6迁移建议
谢谢,如果我们可以使用这些模板,那将是完美的,但我们有** 2个mySQL表**,我们希望将其存储为** 1个单独的DynamoDB表**。这些模板有用于处理单个表格的选项,但不包括2.是否有解决此问题的方法,这不涉及预处理? (这将是我们的最后手段 - 将2个mySQL表加入一个mySQL表,因为它需要很多时间和空间) –
嗨Ankit。在这种情况下,您需要在管道中包含EMR集群。工作流程应该是:将两个表格以分开的csv移动到S3,EMR集群将合并/连接表并将输出转到S3,最后将数据导入到DynamoDB。在这里,您需要为合并/合并作业开发一点点。使用Hadoop命令可轻松导入/导出到EMR中的S3。 – AGL