2016-10-18 39 views
1

在拨浪鼓中运行描述性统计信息,需要知道结果中的“信息”是什么。无法在小插曲中找到任何信息。这里就是我讲的一个例子:拨浪鼓“信息”得分数据集描述

 
Variable1 
     n missing unique Info Sum Mean 
    89588  0  2 0.61 25735 0.2873 

我们认为它是0到1分,但我们无法找到确切的定义。

+0

您使用了哪个拨浪鼓命令来获得上面给出的输出?您能否提供更多的上下文,例如一段代码或数据? – Joy

+0

快乐 - 使用拨浪鼓()功能调用拨浪鼓GUI。该数据集已被加载,并在“探索”选项卡下,我们选择“描述”数据。我们其中一个变量的输出在评论中。 –

回答

2

Rattle中使用的描述函数来自HMisc包。

在HMisc的文档::描述这种据说大约信息:

对于数值变量,描述增加了称为信息的项目,其是使用 比例优势的相对效率的 相对信息测度/ Wilcoxon测试变量相对于同一个 测试的变量没有关系。信息与变量的连续性如何相关,并且关系的危害性越小,则存在更多的无关值 。 Info的公式为1减去 数值的相对频率除以1减去样本大小倒数的平方的立方的总和。最低的信息来自一个 变量,它只有一个唯一值,然后是高度倾斜的 二元变量。信息被报告为小数点后两位。

+0

谢谢!正是我需要的。 –

+0

@Phiver,有关该措施的实际影响的任何想法? – Rob