1

我特别感兴趣的是,如何能够处理大量的信息以用于Google搜索或Google地图等商业服务。我们都知道他们使用(或至少)“做”了一种Linux集群,但他们究竟是如何组织的?他们使用什么样的硬件,哪些文件系统,网络,哪些问题最频繁?Google搜索/地图Linux群集的软件/硬件结构?

+1

http://research.google.com/pubs/papers.html是开始的地方。 – 2010-06-09 22:39:14

回答

1

答案取决于你正在尝试做什么。谷歌创建了自己的发布数据库,但他们也创建了自己的计算机农场和其他许多东西。一旦你决定采用同样的方式,就不会有什么简单的事情要做,但是肯定你需要投入数百万美元来投资基础设施和开发。 Matthew在评论中提供了关于Google所做工作的数学链接。

但是,如果您的目标是创建Web应用程序,那么您可能不想花时间自行创建infrasturucture,而是使用市场上已有的产品。如果您希望创建可以处理大量数据的应用程序,并且每小时都能为数百万客户提供服务,那么您应该定义一下云计算基础设施,如Amazon Elastic Computing Cloud和Microsoft Azure。

优势在于,您可以以合理的价格获得巨大的计算场,并实现了数据库应用程序和即时可扩展性,并且不会产生与其相关的IT成本。当需求峰值通过时,您可以立即将其从一台服务器扩展到一百台,然后再回到一台。

这里的亚马逊弹性计算云的描述: http://aws.amazon.com/ec2/

这里是他们的可扩展的数据库服务描述: http://aws.amazon.com/simpledb/ http://aws.amazon.com/rds/