最近我正在考虑在生产环境中使用Amazon RDS多可用区域部署服务,并且我已阅读相关文档。Amazon RDS的多可用区域部署如何实现?
但是,我有一个关于故障转移的问题。在Amazon RDS的常见问题解答中,故障转移描述如下:
问:在多可用区故障转移过程中会发生什么,需要多长时间?
故障转移由Amazon RDS自动处理,因此您可以尽快恢复 数据库操作,而无需管理员干预。在故障转移时,Amazon RDS只需简单地将您的数据库实例的规范 名称记录(CNAME)翻转为指向备用数据库 ,该备用数据库又会升级为新的主数据库。我们鼓励您 遵循最佳实践并在应用层执行数据库连接重试 。故障转移时间是其执行故障恢复完成时间的函数。从开始到结束,故障转移通常在3分钟内完成。
从上面的描述中,我想必须有一个监测服务,它可以检测主实例的故障并进行翻转。
我的问题是,哪个AZ做这个监控服务主机?有3种可能性: 1.同样AZ作为主 2.同AZ作为待机 3.另一个AZ
显然1 & 2将不会是这种情况,因为它不能处理这种情况的是整个AZ不可用。那么,如果3是这种情况,那么监控服务的AZ是否会下降呢?是否有另一项服务来监控这个监控服务?这似乎是一个无尽的多米诺骨牌。
那么,亚马逊如何确保多可用区域部署中RDS的可用性?
如果两个AZ之间的通信被破坏,那么会发生什么? – ciphor
@ciphor comms链接不仅可能,但肯定是多余的,与其他所有内容一样。你的问题是一个系统的可靠性和可用性。这一切都涉及到应用冗余和降低风险的问题。虽然,它永远不会是完美的。 – Viccari
另外我有一个查询如何,如果我的主要RDS dbinstance在N.Virginia地区,那么我怎么能找到辅助DBinstance驻留在哪里? – user3086014