statistics

    -1热度

    3回答

    我正在尝试生成一些数据,例如:年龄与一周内堆栈溢出花费的小时数。我尝试使用randn函数,但它不能控制生成的值的范围和值的量化。我尝试了一些算法,例如盒子加工方法,但同样的问题也出现在那里。可以生成两个均匀变量,但对正态分布值的控制是什么?有人可以解释我,我怎么可以在Python中执行此操作?

    2热度

    2回答

    我对Python很新,所以我认为这可能是一个基本问题。我在网上找到了一些解决方案,但无法找到我正在寻找的确切的东西。目前我正在寻找一种方法来查找超过3列数据的“低中位数”。如果只有2列的3列填充,那么我想采取较低的值。 以下是我发现至今 df['median']=np.nanmedian(df[['val1','val2','val3']], axis=1) 以上不是一个可行的解决方案,因为我

    1热度

    1回答

    我刚刚遇到了使用integral2或integral3在MATLAB中计算CDF的问题。假设我有两个独立的正态随机变量X和Y,平均值向量是mu = [5;50],协方差矩阵是c = [3^2,0; 0,3^2]。 因为它们是独立的,联合PDF是两个PDF的乘法,我用下面的代码来计算的概率在整个域, integral2(@(x,y) normpdf(x,5,3).*normpdf(y,50,3),-

    1热度

    1回答

    我在使用合意包进行优化时遇到了R代码问题,因此我的工作基于this document。 我的代码是这样的: library(desirability) #Desirability function ##Function creation Aldeh_ther<-function(x) ((1/(-0.4349834+(0.0150467*x[1])+(0.0086295*x[2])-(0.

    0热度

    1回答

    我想用多个分子/粒子对布朗运动进行建模并对它们进行动画处理。到目前为止,我已经拿出了这个代码解决方案,但我无法得到期望的结果。以下是我的代码 N = 500; % number of samples tau = .1; % time interval in seconds D = 10; % diffusion coefficient NumMolecules = 500; % number

    -1热度

    2回答

    我正在处理我的字段中的统计分析,并使用C++。我正在实施几项测试,其中一些需要比较计算值与表格,比如分配表格,例如this one. 我希望我的不同类别中的不同功能能够访问特定值,来评价我的结果的意义,例如像这样: float F = fisherTest(serie1, serie2); auto tableValue = findValue(serie1.size(), serie2.siz

    2热度

    1回答

    所以我有这个离散数据集合my_dat,我试图拟合曲线以便能够根据my_dat生成随机变量。我在连续数据上使用fitdistrplus取得了巨大成功,但尝试将其用于离散数据时出现了许多错误。 表设置: library(fitdistrplus) my_dat <- c(2,5,3,3,3,1,1,2,4,6, 3,2,2,8,3,4,3,3,4,4, 2,1,5,3,

    -1热度

    1回答

    我在计算转移概率矩阵时遇到了麻烦。我有几个ID和他们的搜索模式(页面访问)。例如: Id Page 1 A 1 A 1 B 2 C 2 C 3 D 3 E 3 F 1 D 1 G 4 G 4 C 4 H 2 D 2 C 我也有页面的初始概率:P_a,....,P_h。如何在R(最好)或Python中进行编码,以获得所有id的Page变量的转换概率矩阵。我知道如何做

    0热度

    2回答

    我正在使用R执行我的分析,我将执行四种算法。 1. RF 2. Log Reg 3. SVM 4. LDA 我有50个预测变量和1个目标变量。我所有的预测变量和目标变量都只有二进制数字0和1。 我有以下问题: Should I convert them all into factors? Converting them into factors, and applying RF alg

    2热度

    1回答

    我试图显示非对称t分布或正态分布是否更适合某个数据集。在这样做时,我决定叠加一个拟合的正态分布和一个拟合的t分布。对于正态分布,这是没有问题的使用stat_fun: x <- data.frame(rnorm(500)) names(x) <- c("test.data") ggplot(x,aes(x=test.data)) + stat_function(fu