statistics

-1热度

3回答

我正在尝试生成一些数据，例如：年龄与一周内堆栈溢出花费的小时数。我尝试使用randn函数，但它不能控制生成的值的范围和值的量化。我尝试了一些算法，例如盒子加工方法，但同样的问题也出现在那里。可以生成两个均匀变量，但对正态分布值的控制是什么？有人可以解释我，我怎么可以在Python中执行此操作？

2热度

2回答

高效地找到多个列的低中位数

我对Python很新，所以我认为这可能是一个基本问题。我在网上找到了一些解决方案，但无法找到我正在寻找的确切的东西。目前我正在寻找一种方法来查找超过3列数据的“低中位数”。如果只有2列的3列填充，那么我想采取较低的值。以下是我发现至今 df['median']=np.nanmedian(df[['val1','val2','val3']], axis=1) 以上不是一个可行的解决方案，因为我

1热度

1回答

使用integral2或integral3来计算MATLAB中的CDF

我刚刚遇到了使用integral2或integral3在MATLAB中计算CDF的问题。假设我有两个独立的正态随机变量X和Y，平均值向量是mu = [5;50]，协方差矩阵是c = [3^2,0; 0,3^2]。因为它们是独立的，联合PDF是两个PDF的乘法，我用下面的代码来计算的概率在整个域， integral2(@(x,y) normpdf(x,5,3).*normpdf(y,50,3),-

1热度

1回答

R合意性分析

我在使用合意包进行优化时遇到了R代码问题，因此我的工作基于this document。我的代码是这样的： library(desirability) #Desirability function ##Function creation Aldeh_ther<-function(x) ((1/(-0.4349834+(0.0150467*x[1])+(0.0086295*x[2])-(0.

0热度

1回答

具有多个分子/粒子的布朗运动[Matlab]

我想用多个分子/粒子对布朗运动进行建模并对它们进行动画处理。到目前为止，我已经拿出了这个代码解决方案，但我无法得到期望的结果。以下是我的代码 N = 500; % number of samples tau = .1; % time interval in seconds D = 10; % diffusion coefficient NumMolecules = 500; % number

-1热度

2回答

将值与C++中的静态和全局表进行比较

我正在处理我的字段中的统计分析，并使用C++。我正在实施几项测试，其中一些需要比较计算值与表格，比如分配表格，例如this one. 我希望我的不同类别中的不同功能能够访问特定值，来评价我的结果的意义，例如像这样： float F = fisherTest(serie1, serie2); auto tableValue = findValue(serie1.size(), serie2.siz

2热度

1回答

R：使用fitdistrplus来拟合离散数据直方图上的曲线

所以我有这个离散数据集合my_dat，我试图拟合曲线以便能够根据my_dat生成随机变量。我在连续数据上使用fitdistrplus取得了巨大成功，但尝试将其用于离散数据时出现了许多错误。表设置： library(fitdistrplus) my_dat <- c(2,5,3,3,3,1,1,2,4,6, 3,2,2,8,3,4,3,3,4,4, 2,1,5,3,

-1热度

1回答

马尔可夫转换概率矩阵

我在计算转移概率矩阵时遇到了麻烦。我有几个ID和他们的搜索模式（页面访问）。例如： Id Page 1 A 1 A 1 B 2 C 2 C 3 D 3 E 3 F 1 D 1 G 4 G 4 C 4 H 2 D 2 C 我也有页面的初始概率：P_a，....，P_h。如何在R（最好）或Python中进行编码，以获得所有id的Page变量的转换概率矩阵。我知道如何做

0热度

2回答

分类任务中的所有二元预测变量

我正在使用R执行我的分析，我将执行四种算法。 1. RF 2. Log Reg 3. SVM 4. LDA 我有50个预测变量和1个目标变量。我所有的预测变量和目标变量都只有二进制数字0和1。我有以下问题： Should I convert them all into factors? Converting them into factors, and applying RF alg

2热度

1回答

使用ggplot2叠加不对称t分布

我试图显示非对称t分布或正态分布是否更适合某个数据集。在这样做时，我决定叠加一个拟合的正态分布和一个拟合的t分布。对于正态分布，这是没有问题的使用stat_fun： x <- data.frame(rnorm(500)) names(x) <- c("test.data") ggplot(x,aes(x=test.data)) + stat_function(fu