2012-06-08 18 views
0

我有选择存储在特定标记标准中的文件,这些文件在组合时构成整个文本量。该文本有许多不同的语言可供使用,并且这些文件中的每一个都是针对该语言进行复制的。存储,检索和显示大量的文本

为了通过网络应用程序存储,检索并向潜在的很多用户显示这些信息,我需要实现最合适的方法。目前我正在考虑沿着以下方向:

将文件转换为XML(标记语言旨在使此操作变得可能),然后在用户想要查看该部分时加载相关文件。我使用Rails和Ember.js来显示结果,所以(我认为)要求数据使用JSON格式。

我的问题是:

我应该将XML转换为JSON,并存储在一个文件或将是更好的XML中的每个被请求时转换? 我应该将数据存储在文件中,还是应将它们移动到数据库? 考虑到文本的每个部分都可以有脚注和其他引用,如果我沿着数据库路线走下去,对于每种语言,将每个节作为字段存储在表中会更好吗?或者每种语言都应该有自己的表格?我是否应该进一步打破这一点,并在语言中的每个部分都有一个表格,其中包含段落,脚注,参考等字段?

我在回答最好的方法来实现这个,而不是实际的方法能够实现它。谢谢。

+0

我只是在大声思考,但是因为我最终会希望能够搜索文件内容,所以我猜数据库是最好的方法或者我可以轻松地对文件的多个关键字进行全文搜索? –

回答

0

我已经使用eXist来存储XML文档,并且它对我很好。它是一个XML数据库,允许您存储XML文档并通过XPATH和XQUERY查询它们。还有一些Lucene集成用于基于文本的搜索。如果您正在考虑存储XML,您可能需要查看它。