这个问题与应用程序开发并不完全相关,但从体系结构的角度来看并非如此。假设一个应用程序必须在AWS上托管,这将需要来自多个外部第三方持有数据库的通信(不是必须在AWS上,可能是他们自己的数据中心或托管) - 也许一个客户端将使用MySQL,另一个客户端一个MSSQL或Oracle等。AWS上托管的应用程序访问多个外部数据库
因此,保存在这些外部数据库中的数据可能会频繁更改,并且应用程序应始终检索更新的数据。我能想到的一种方式是使用另一个RDBMS数据库(从我们这边)专门存储来自外部数据库的所有这些数据,并始终保持我们的数据库同步。但我不确定这是否是实现这一目标的好方法。
或者是否需要使用像Redshift这样的数据仓库工具来存储实时同步的所有数据,然后在我们的应用程序中使用DW数据?根据这里的架构师,这对于实现这个目标有什么好的解决方案,主要是通过多个外部数据库连接和同步?
您可以连接VPC和远程数据中心之间的连接,也可以使用Direct Connect服务实现更好的连接。 –
如果您可以提供更多关于您的用例的信息以提供更好的答案,那将是非常好的。那么你指的是什么样的应用程序?了解您在这些外部数据库中所拥有的大致数据量也很重要。你需要同步所有的数据还是部分?您需要多久才能将新数据提供给其他数据库? – Ashan
@Ashan:这可能是一个将被公众使用的移动应用程序(android/ios)。我无法找到外部数据库的确切大小。由于从我需要检索数据的位置将会有多个位置/客户端数据库,因此我认为至少有一个TB数据在那里。所以,如果没有同步数据的解决方案,我没关系 - 只是我的移动应用程序应该与许多客户端的许多DB进行通信并实时获取所需的信息。 我希望这会给你一个更大的图片。 – serverstackqns