statistics

-1热度

1回答

我想绘制出版物的正常分布的3个数字，但我只得到一个很好的数字（英国）。其余两个（美国和日本）的曲线不完整。我将曲线拟合成直方图，因此您可以说每个图需要保存两个图，即直方图和高斯分布。请看看我的代码的一部分，让我知道如何解决这个问题。我很乐意提供建议，谢谢。我Matplotlib数字：fitted distribution，fitted distribution，fitted distrib

0热度

1回答

计算Inv Chi Squared Java

那么我正在为java编写一个测试模拟subjet的pseudoRandom数字，我需要计算Chi平方的倒数，所以我有alpha和度数as you can see here。的书我读，利用Excel函数Excel ChiSQ.INV这样的： CHISQ.INV(probability,deg_freedom) CHISQ.INV(0.025,39) = 58.12005973 < - 这个值是什么

-1热度

1回答

如何计算高尔距离权重

所以我使用高尔距离做出一些集群，但我一直在试图寻找一种具体的方法来计算变量的权重，我还没有发现有用的东西。在一些示例中，它们使用1和4之间的值，并且在其他示例中它们使用0至150或更多的值，所以是否存在限制？或者一个实际的方法来计算它们？谢谢。

1热度

1回答

计算PRESS统计/预测Rsquared C＃

我想创建一个方法，将使用C＃计算PRESS统计信息，但我显然没有做正确的事情，因为即使我使用垃圾数据（它的rsquared值为0.2 ）我仍然得到新闻统计的负面总数。有没有人看到我在做什么错了？参考如何计算按统计可以https://en.wikipedia.org/wiki/PRESS_statistic public double CalculatePredictedRSquared(List

0热度

1回答

为什么这会导致我的程序崩溃？

我创建了以下用户定义的函数，它使用Acceptance-Rejection方法生成随机变量。然而，每当它被调用时，我的程序就会继续，最终崩溃或者我不得不强制退出。我经历了几次。任何想法可能会导致这种情况？我知道，这可能不是写这个的最好方法（昨天是我第一次使用R），所以任何额外的提示都是奖励！ acceptReject <- function(){ Z <- 0 Y <- c(

1热度

1回答

sql - 针对列样本中的每个唯一值2来自另一列的不同值

我困在一个困难的sql聚合问题上。考虑下面的表/视图： Column1 Column2 1 2564 2 6550 1 3578 2 6548 2 4789 1 9876 我想设计一个查询，以做到以下几点：对于每一个不同的列1值，样品2分的记录。采样策略可能是某种引导/重新采样，因为可能没有太多的数据点。因此该表将成为： Column1 Column2 1

-1热度

1回答

X和Y是不相关的（0.3）;然而，当我把X在随机森林分类预测Y，旁边两（A，B）其他（相关）变量，X和两个其他变量（A，B）为Y.注意的显著预测的是，其他两个（A， B）变量也无法与Y. 相关怎样才能根据统计和机器学习的想法解释这一点。代表一个或多个可变（A或B或Y）相对于另一变量（X），其中变量不具有很强的相关性。

-1热度

1回答

个人X值的平均Y值

我有一个.dta格式的数据集，包含棒球运动员的身高和体重。我想计算每个体重值的平均身高。从我所能找到的，我可以使用dplyr和“group_by”，但我的R脚本无法识别该命令，尽管已安装并调用该程序包。谢谢！

1热度

1回答

Python-如何做2D数组的f测试？

问题我有两个数组，我们会打电话给他们AR1和AR2（大小（192289）），代表LAT-LON标准偏差的地图，我有一个同样大小的数组区别。我想绘制这个差异，并且在两个阵列之间的差异在统计上显着的95％置信水平（α= 0.05）上的点状模式上。我是用我的coding-这个例子的代码 How do I do a F-test in python 我用乔尔·科内特的解决方案，替代ar1并在X ar2

-1热度

1回答

Python和Stata中强大的线性回归结果不同意

我和我的同班同学正在完成这项任务，涉及在Fama-French 3因子模型上运行回归。我使用python Statsmodels模块，他们使用Stata，我们共享相同的一组数据。对于普通最小二乘回归，我们得到了相同的答案。但由于某种原因，稳健的回归结果并不一致。下面是塔塔结果：这里是Statsmodels结果：只是想知道这可能是这个问题的原因是什么？任何方式来解决它？我还在Statsmode