statistics

    0热度

    1回答

    我想创建与均值的泊松分布是2数目的元素为10000具有最小值1和尾部值140到目前为止我只能指定分钟 stats.poisson.rvs(2, loc = 1,size=10000) 和生成以下分布 我怎样才能使它结束在140而不是11

    -1热度

    1回答

    我有5个不同大小的数据集,对于每个数据集,我选择了10个与数据库大小相同的bootstrap样本,对于每个样本,我都有真正的正数,真正的负数,误报,假负数和样本的意思。即使它们具有不同的尺寸,我是否可以合计所有样本值?使用R构建所有数据库的ROC曲线的最佳方法是什么?什么是最好的统计测试?我尝试使用pROC和ROCR包,但它们需要预测值和类(它们是我没有的值,我只有tp,tn,fp和fn的值)。

    0热度

    1回答

    我想用我拥有的数据集做一个天真的预测,我正在努力做一点。 values = DataFrame(dataset.iloc[:, -1]) Y_naive = pd.concat([values.shift(24), values], axis=1) Y_naive.columns = ['t', 't+1'] x = Y_naive.values 我基本上有什么是

    0热度

    2回答

    我有两个数据框案例和对照,我执行了两个样本t检验,如下所示。但我正在从特征集中进行特征提取(1299特征/列),所以我想计算每个特征的p值。基于为每个要素生成的p值,我想拒绝或接受零假设。 任何人都可以向我解释如何解释下面的输出,以及如何计算每个功能的p值? t.test(New_data_zero,New_data_one) Welch Two Sample t-test data

    0热度

    1回答

    给定具有非均匀分布(高度尖峰)的数据集,我想重新采样以创建具有大致均匀分布的新数据集。我的方法: 将数据分成分档。 目标箱水平=所有箱中每个箱的最小样本数。 随机删除样本,直到每个bin计数=目标bin级别。 有没有更好的技术?

    0热度

    1回答

    我正在为我的工作编写ffmpeg链进程脚本。目标是正常化/压缩很多音频文件(mp3)。 它在Python完成,关键的部分是线: ffmpeg -y -i "Input.mp3" -codec:a libmp3lame -b:a 96k -af acompressor=threshold=-15dB:ratio=5:attack=0.01:release=1000:knee=2,dynaudnorm

    0热度

    2回答

    我对Iris数据集Iris data-set执行了t检验。我计算了萼片和花瓣的长度和宽度之间的比例,并创建了一个名为IrisLeafRatio.csv的新数据集。 import scipy.stats as stats # First, we'll import pandas, a data processing and CSV file I/O library import pandas

    2热度

    1回答

    看起来在最新版本的熊猫中,所有的ols功能都已被弃用(pandas.stats已被删除,并且没有PanelOLS或ols函数) 。我正在尝试使用statsmodels运行面板回归,但找不到有效的方式来执行此操作?以前我可以用这样的代码: panel_ols = ols(y=DataFrame, x=DataFrame, ...,) 这估计使用一个单一的面板回归中的所有数据系数。 现在有办法做到

    0热度

    1回答

    我有一个矩阵操作Y=B*A*X;;其中A=exp(1i.*pi*rand(50,50)); B=transpose(A); X为,其输入是随机 X=exp(1i.*pi*rand(50,50)); 所以我ÿ计算。 现在我发现另一个Y说Y1为另一个X1=exp(1i.*pi*rand(50,50)); Y和Y1是复杂的输出。我如何度量这些文件之间的相似度? 有人可以请帮忙。我试过 rsme=sq

    1热度

    1回答

    当计算G *所需的样本量时,重复测量,内部相互作用ANOVA,输出中“总样本量”是指什么?每组需要参与者的人数还是所有组的总数?