我的工作是为静态图像/视频文件设计分布式系统。数据的大小约为几十太字节。它主要用于HTTP访问(因此不需要对数据进行处理;或者只进行简单的处理,例如调整大小 - 但这并不重要,因为它可以直接在应用程序中完成)。从Hadoop发送静态文件
为了更加清楚一点,那就是一个系统:
- 必须分布(水平刻度),因为数据的总规模是非常大的。
- 主要通过HTTP提供小静态文件(如图像,缩略图,短视频)。
- 通常,不需要处理数据(因此不需要MapReduce)
- 设置对数据的HTTP访问可以轻松完成。
- (应该有)吞吐量好。
我正在考虑:
本地网络文件系统:但是因为数据无法放入一台机器似乎并不可行。
Hadoop文件系统。我以前使用过Hadoop mapreduce,但我没有经验将Hadoop用作HTTP请求的静态文件存储库。所以我不知道这是可能的还是推荐的方式。
MogileFS。看起来很有前途,但我觉得使用MySQL来管理本地文件(在一台机器上)将会产生太多的开销。
有什么建议吗?
嗨克里斯,我一直在探索可用于分布式服务器的服务图像的选项和杂草fs outshone所有。我想知道,如果将文件中的文件组织到文件夹中,是否存在任何缺点。我真的很新,没有太多可用的信息,这就是为什么我直接与你联系。急切地等待你的回应。也请我可以得到一个示例配置XML。我正在使用ubuntu,jdk-8,并通过由zhangxu创作的java客户端连接 – qualebs
您需要有一个地方来存储上传文件的生成文件ID。如果您需要遍历文件夹,可能还可以将文件夹与文件ID一起存储。或者你可以使用weed-fs filer。 – chrislusf