statistics

    -1热度

    1回答

    我想绘制出版物的正常分布的3个数字,但我只得到一个很好的数字(英国)。其余两个(美国和日本)的曲线不完整。 我将曲线拟合成直方图,因此您可以说每个图需要保存两个图,即直方图和高斯分布。 请看看我的代码的一部分,让我知道如何解决这个问题。 我很乐意提供建议,谢谢。 我Matplotlib数字:fitted distribution,fitted distribution,fitted distrib

    0热度

    1回答

    那么我正在为java编写一个测试模拟subjet的pseudoRandom数字,我需要计算Chi平方的倒数,所以我有alpha和度数as you can see here。 的书我读,利用Excel函数Excel ChiSQ.INV这样的: CHISQ.INV(probability,deg_freedom) CHISQ.INV(0.025,39) = 58.12005973 < - 这个值是什么

    -1热度

    1回答

    所以我使用高尔距离做出一些集群,但我一直在试图寻找一种具体的方法来计算变量的权重,我还没有发现有用的东西。 在一些示例中,它们使用1和4之间的值,并且在其他示例中它们使用0至150或更多的值,所以是否存在限制?或者一个实际的方法来计算它们? 谢谢。

    1热度

    1回答

    我想创建一个方法,将使用C#计算PRESS统计信息,但我显然没有做正确的事情,因为即使我使用垃圾数据(它的rsquared值为0.2 )我仍然得到新闻统计的负面总数。有没有人看到我在做什么错了? 参考如何计算按统计可以https://en.wikipedia.org/wiki/PRESS_statistic public double CalculatePredictedRSquared(List

    0热度

    1回答

    我创建了以下用户定义的函数,它使用Acceptance-Rejection方法生成随机变量。然而,每当它被调用时,我的程序就会继续,最终崩溃或者我不得不强制退出。我经历了几次。任何想法可能会导致这种情况? 我知道,这可能不是写这个的最好方法(昨天是我第一次使用R),所以任何额外的提示都是奖励! acceptReject <- function(){ Z <- 0 Y <- c(

    1热度

    1回答

    我困在一个困难的sql聚合问题上。 考虑下面的表/视图: Column1 Column2 1 2564 2 6550 1 3578 2 6548 2 4789 1 9876 我想设计一个查询,以做到以下几点: 对于每一个不同的列1值,样品2分的记录。采样策略可能是某种引导/重新采样,因为可能没有太多的数据点。 因此该表将成为: Column1 Column2 1

    -1热度

    1回答

    X和Y是不相关的(0.3);然而,当我把X在随机森林分类预测Y,旁边两(A,B)其他(相关)变量,X和两个其他变量(A,B)为Y.注意的显著预测的是,其他两个(A, B)变量也无法与Y. 相关怎样才能根据统计和机器学习的想法解释这一点。 代表一个或多个可变(A或B或Y)相对于另一变量(X),其中变量不具有很强的相关性。

    -1热度

    1回答

    我有一个.dta格式的数据集,包含棒球运动员的身高和体重。我想计算每个体重值的平均身高。 从我所能找到的,我可以使用dplyr和“group_by”,但我的R脚本无法识别该命令,尽管已安装并调用该程序包。 谢谢!

    1热度

    1回答

    问题 我有两个数组,我们会打电话给他们AR1和AR2(大小(192289)),代表LAT-LON标准偏差的地图,我有一个同样大小的数组区别。我想绘制这个差异,并且在两个阵列之间的差异在统计上显着的95%置信水平(α= 0.05)上的点状模式上。 我是用我的coding-这个例子的代码 How do I do a F-test in python 我用乔尔·科内特的解决方案,替代ar1并在X ar2

    -1热度

    1回答

    我和我的同班同学正在完成这项任务,涉及在Fama-French 3因子模型上运行回归。我使用python Statsmodels模块,他们使用Stata,我们共享相同的一组数据。对于普通最小二乘回归,我们得到了相同的答案。但由于某种原因,稳健的回归结果并不一致。 下面是塔塔结果: 这里是Statsmodels结果: 只是想知道这可能是这个问题的原因是什么?任何方式来解决它?我还在Statsmode