2012-06-25 31 views
0

根据this文章,每个集群都有自己的存储空间。Hotmail群集数据存储如何工作?

集群主机上百万用户(多少取决于硬件的年龄),是一个自包含的一组服务器,其中包括: 前端服务器 - 服务器是用于检查病毒和举办代码可与您的浏览器或电子邮件客户端,使用诸如POP3和DeltaSync 后端服务器 - SQL和文件存储服务器,垃圾邮件过滤器,监控 - 和垃圾邮件的数据,目录代理的存储和服务器处理入站和出站邮件。 负载均衡 - 硬件和软件用来均匀地分配负载更多获得更快的性能。

我猜哪个集群用户被分配到由所在地区(IP地址)来决定。在这种情况下,如果我把自己的电子邮件,德国,然后是检查我的电子邮件,当我来到美国,我被分配到不同集群(因此不同的SQL数据库)。所以对我来说,能够看到电子邮件在美国,这是否意味着在所有的集群所有的数据库都在不断同步?

回答

1

地理最可能你是如何分配一个群集(认为它像一个内容分发网络)。我想你是对与这种假设。

当然我不能可以肯定地说,这一切是如何运作的,但是从我与其他大型提供商的经验来看,我的想法如下:

电子邮件冗余存储在一个集群内(所以机器/硬盘驱动器的损失)而且这些群集也可能(可能)冗余存储在地理位置不同的位置,从而导致大规模停电和灾难对最终用户影响较小。这种推/拉一直在数据集群内完成(考虑像HDFS这样的文件系统)以确保n级冗余。由于在任何给定小时内登录到不同群集中的系统的机会都很小,因此不需要实时同步信息(就可用性而言),但可能需要大约几分钟/小时,并且可以尽可能快地运行它们的机器以确保数据的持久性。

群集设置可能是类似亚马逊:东/西海岸集群,一个集群欧元,和不同的地方有很多其他用户的是,亚洲群集(或两个或三个)。这些数据之间的推拉并不是分钟的规模,而是几小时。

这一切冗余和同步是很重要的是要记住的其他服务,如你所提到的职位,如SkyDrive的和信使全部共享这个sayme基础设施的文章。