2012-02-22 122 views
0

上午建立一个网站,将有文章,政策和法律和文字的东西。我在MSSql 2008数据库中存储了所有数据(在某些情况下,超过8000个字符的文章)。我读了一些文章,他们说文本数据不应该存储在数据库中。他们应该在哪里储存?在.txt文件或东西?我也想搜索数据。如果它们存储在数据库中,我可以使用存储过程等。如果存储在文档中,我需要使用像Lucene这样的工具。我对吗?我的方法是在这个项目中使用数据库错误吗?请赐教。构建文本内容网站的正确方法是什么?

+0

[引文需要]。文本数据应该存储在数据库中,这就是他们的用途。你确定你没有阅读过“**图片**数据不应该存储在数据库中”吗? (甚至有争议) – Piskvor 2012-02-22 11:39:27

+0

本文中的http://trycatchfail.com/blog/post/Introduction-to-LuceneNET.aspx请参阅“为什么不使用SQL Server?”一节。 – heaVenShaker 2012-02-22 11:47:31

+0

你错了。它说“不要使用SQL Server来存储*和搜索* **大量的文本**”(重点是我的)。 8000个字符(从数据库的角度来看)不是大量的文本,而不是2012年。您需要所有文章至少放大一百倍,直到问题开始显现。对于这样的网站,你所描述的,MSSQL是足够的。还要注意文章是*全文搜索*,而不仅仅是存储和检索。 – Piskvor 2012-02-22 11:53:24

回答

0

您将使用的一些说明对这一项目DB不管你如何看待它,不管它是: 1)一个老式的平面文件数据库(TXT文档,不建议用于大型项目恕我直言) 2)传统文本存储数据库 3)文档数据库

是否使用文本数据库或文档数据库的参数取决于您拥有或可能访问哪些技能/知识(或帮助用)。这听起来像你对文本数据库更加舒适,而且我认为这没什么不妥 - 最糟糕的情况是,如果最终确实需要长期使用文档而不是直接文本存储你应该能够从文本数据库自动生成文档 - 我怀疑做相反将会更加棘手(将专有文档的负载转换为文本进行存储和插入)。从文本数据库生成纯文本文件很简单,大多数供应商文档格式支持导入纯文本文档以供后续格式化。

对于一个大型项目这样,你真的需要花一些时间考虑你的文件有可能被用于通过谁,什么方法最适合他们。如果您为大量使用MS Word并希望下载数据的用户提供数据库,则可能需要考虑使用文档数据库。如果它只是你想提供的信息(和基于网络的工具),你想要考虑如何操纵你自己的数据。

这是所有的意见很明显,但我最后的建议是一定要使用从一开始就UTF-8文本,如果你走的路线文本(痛苦的经历)。

+0

:)好的感谢您的意见 – heaVenShaker 2012-02-22 12:17:05

相关问题