我有一个Excel电子表格,我将变成一个数据库来挖掘数据并构建一个交互式应用程序。大约有20列和80,000条记录。实际上,所有记录都有大约一半的列数据为空,但哪一列的数据对于每条记录都是随机的。什么是更重要的,规范化或易于编码?
的选项将是:
与表中的每个列创建一个更加标准化DB,并使用20联接,以查看所有数据。我认为好处将是一个真正没有NULL值的DB,因此它的大小会更小。其中一个主要缺点是更多的代码来更新应用程序端的每个表。
创建一个包含所有列的表的平面文件。我认为这对于应用程序端执行更新会更容易,但会导致一个表空间数据空间的对接加载。
“多空字段”和规范化之间的关系是什么?如果您在2011年1月1日... 1/20/2011有80,000个不同的数据库程序员(由他们的社会安全号标识)和20列,以表明他们是否在这一天对数据库进行了规范化处理,如果稀疏 - 表。为了优化存储,你需要一个(不是二十个)表(ssn,date)。 – 2011-05-06 19:58:17