statistics

0热度

1回答

我想创建与均值的泊松分布是2数目的元素为10000具有最小值1和尾部值140到目前为止我只能指定分钟 stats.poisson.rvs(2, loc = 1,size=10000) 和生成以下分布我怎样才能使它结束在140而不是11

-1热度

1回答

我有5个不同大小的数据集，对于每个数据集，我选择了10个与数据库大小相同的bootstrap样本，对于每个样本，我都有真正的正数，真正的负数，误报，假负数和样本的意思。即使它们具有不同的尺寸，我是否可以合计所有样本值？使用R构建所有数据库的ROC曲线的最佳方法是什么？什么是最好的统计测试？我尝试使用pROC和ROCR包，但它们需要预测值和类（它们是我没有的值，我只有tp，tn，fp和fn的值）。

0热度

1回答

天真的天气预报

我想用我拥有的数据集做一个天真的预测，我正在努力做一点。 values = DataFrame(dataset.iloc[:, -1]) Y_naive = pd.concat([values.shift(24), values], axis=1) Y_naive.columns = ['t', 't+1'] x = Y_naive.values 我基本上有什么是

0热度

2回答

如何使用两个样本t检验计算R中每个特征的p值

我有两个数据框案例和对照，我执行了两个样本t检验，如下所示。但我正在从特征集中进行特征提取（1299特征/列），所以我想计算每个特征的p值。基于为每个要素生成的p值，我想拒绝或接受零假设。任何人都可以向我解释如何解释下面的输出，以及如何计算每个功能的p值？ t.test(New_data_zero,New_data_one) Welch Two Sample t-test data

0热度

1回答

从非均匀数据创建均匀分布的示例

给定具有非均匀分布（高度尖峰）的数据集，我想重新采样以创建具有大致均匀分布的新数据集。我的方法：将数据分成分档。目标箱水平=所有箱中每个箱的最小样本数。随机删除样本，直到每个bin计数=目标bin级别。有没有更好的技术？

0热度

1回答

如何计算ffmpeg astats波峰因数

我正在为我的工作编写ffmpeg链进程脚本。目标是正常化/压缩很多音频文件（mp3）。它在Python完成，关键的部分是线： ffmpeg -y -i "Input.mp3" -codec:a libmp3lame -b:a 96k -af acompressor=threshold=-15dB:ratio=5:attack=0.01:release=1000:knee=2,dynaudnorm

0热度

2回答

stats.ttest_ind返回NoneType对象，但我可以打印它

我对Iris数据集Iris data-set执行了t检验。我计算了萼片和花瓣的长度和宽度之间的比例，并创建了一个名为IrisLeafRatio.csv的新数据集。 import scipy.stats as stats # First, we'll import pandas, a data processing and CSV file I/O library import pandas

2热度

1回答

statsmodels中的面板OLS（因为它在Pandas中不推荐使用）

看起来在最新版本的熊猫中，所有的ols功能都已被弃用（pandas.stats已被删除，并且没有PanelOLS或ols函数）。我正在尝试使用statsmodels运行面板回归，但找不到有效的方式来执行此操作？以前我可以用这样的代码： panel_ols = ols(y=DataFrame, x=DataFrame, ...,) 这估计使用一个单一的面板回归中的所有数据系数。现在有办法做到

0热度

1回答

如何测量matlab中两个二维复杂场之间的相似度？

我有一个矩阵操作Y=B*A*X;;其中A=exp(1i.*pi*rand(50,50)); B=transpose(A); X为，其输入是随机 X=exp(1i.*pi*rand(50,50)); 所以我ÿ计算。现在我发现另一个Y说Y1为另一个X1=exp(1i.*pi*rand(50,50)); Y和Y1是复杂的输出。我如何度量这些文件之间的相似度？有人可以请帮忙。我试过 rsme=sq

1热度

1回答

G *中的功率总样本量 - 在ANOVA内

当计算G *所需的样本量时，重复测量，内部相互作用ANOVA，输出中“总样本量”是指什么？每组需要参与者的人数还是所有组的总数？