significance

    0热度

    2回答

    我想分析文档中的项目,如字母,双字母,单词等,并比较它们在文档中的频率,以及它们对于大型语料库文档。 这个想法是,诸如“如果”,“和”,“该”这样的词在所有文档中都是常见的,但是在该文档中一些词比在语料库中通常更常见。 这必须是非常标准的。这叫什么?这样做明显的方式,我总是有一个问题,在我的文档中的新词,但没有在语料库评级无限重要。这是如何处理的?

    10热度

    2回答

    我想在boxplot图表中的一个盒子的顶部或底部包含一个星号,它表示执行自变量t检验评估后的重要性。我怎样才能把它添加到我的图中?

    7热度

    2回答

    我确定这是R中的简单命令,但由于某种原因,我无法找到解。 我想在R中运行一堆交叉表(使用table()命令),并且每个选项卡有两列(治疗和不治疗)。我想知道所有行的列之间的差异是否彼此显着不同(行是调查中的少数答案选择)。我对整体意义不感兴趣,只在比较治疗与不治疗的交叉表中感兴趣。 这种类型的分析非常容易在SPSS(下面的链接来说明我在说什么),但我似乎无法得到它在R的工作。你知道我可以做到这一点

    1热度

    1回答

    部分我发现这里:How to calculate correlation In R set.seed(123) X <- data.frame(ID = rep(1:2, each=5), a = sample(1:10), b = sample(1:10)) ddply(X, .(ID), summarize, cor_a_b = cor(a,b)) 除了cor(其计算Pearsons

    4热度

    1回答

    我有一组新闻文章,其中有统计数据,例如:提供文章的日期范围的Twitter帖子数量。统计值的自然行为是,新帖子的数量增长迅速,然后随着新闻老化而减少。 我想知道如何计算统计数据变化不再显着的天数(例如:<占职位总数的0.1%),并且对于整个数据集具有一定置信度。 你能否提供一些提示以寻找信息和方法?我会很欣赏Python中的一些代码示例:)

    1热度

    1回答

    我有一些我继承的代码,它可以从预测的手段生成配对比较的显着性水平矩阵。由于该模型包括来自多个地点和治疗方法的数据,但我只想比较一个地点内治疗中的基因型,只有一部分比较是有意义的。 下面是当前生成的虚拟版本。 effect.nam <- expand.grid(site=c("A","B","C"), treat=c("low","high"), genotype=c("A1","B2")) la

    16热度

    2回答

    文件系统块大小的意义是什么?如果我的文件系统块大小被设置为8K,这是否意味着所有读/写I/O都会在8K大小发生?因此,如果我的应用程序想要在偏移4097处读取16个字节,则会读取从偏移量4096开始的4K块? 写入在这种情况下如何工作?假设我想写64个字节。

    2热度

    2回答

    我不是JAVA_OPTS的专家,但我在与我的Grails应用程序相关的Permgen空间中出现错误。现在,我收到来自Grails的推荐博客JAVA_OPTS设置为这个值: JAVA_OPTS =“ - 客户-Xmx256M $ JAVA_OPTS” 我不明白,只是“-client”其他值。这是什么意思?我无法在书中找到它的意义。

    1热度

    1回答

    我真的很喜欢统计数据,但在6年以上没有参加过课程。我很难弄清楚我需要什么类型的测试,以及用于这类问题的最佳numpy/scipy/R函数。 我有一个游客及其相应属性表(例如“Browser = Mozilla,Referrer = Google”),以及每个访问者的变量值(例如5美元),随着时间的推移分组为数据点。 我的目标是: A)找到最显著财产的家庭,与家人“如何显著”是一个结论,我想提请*的

    24热度

    2回答

    我想知道如何为矩阵相关性热图添加另一层重要和所需的复杂性,例如重要性级别除了R2值之外的方式之后的p值(-1至1)? 在这个问题中,并没有将这个问题的重要性级别的星号或p值作为文本显示在矩阵的每个平方上,而是在图像的每个平方上显示出显着性水平上的显着性水平矩阵。我认为只有那些喜欢创新思维的人才能赢得掌声,以解开这种解决方案,以便有最好的方式来表达复杂度的增加部分,以达到我们的“半真相矩阵相关热图”