statistics

    0热度

    2回答

    我试图在Stata减少我的数据。我有多个变量,一个叫做Industry。 我想删除所有属于“银行”的公司。但如果我使用这个命令: drop if Branche!="Banks" Stata只显示我是银行的公司。 你知道如何解决它吗?

    0热度

    1回答

    我正在从数百个URL列表中提取数据,每个URL都包含一个统计棒球数据表。在列表中的每个唯一的URL,对所有单个棒球运动员的职业生涯赛季的表,如下所示: https://www.baseball-reference.com/players/k/killeha01.shtml 我已经成功地创建一个脚本来追加数据从单URL合并成一个列表/数据框。然而,这里是我的问题: 我应该如何调整自己的代码来凑数百个

    0热度

    2回答

    我正在开发折线图。数据由传感器生成并且是元组(时间戳,值)。传感器每60秒左右创建一个新的数据点。 现在我想在图表中显示它,而我的限制是在图形上的大约900个点。在这张图的日常观察中,我得到了大约1440分,这太多了。 我正在寻找一种通用的方法来将任意大小的数据集缩小到固定大小(在我的情况下为900),同时它使时间戳分布保持线性。 感谢

    0热度

    1回答

    我试图适应截短正态分布使用最大似然5000个根据权利要求大小的数据集: l1 = function(theta) { -sum(dtruncnorm(x=size, a=0, b=Inf, mean = theta[1], sd=theta[2])) } mle1=optim(par=c(4,4), fn=l1) 当运行optim(par=c(4, 2), fn=l1)线但是,

    0热度

    1回答

    我有这样的代码,从朱利安Farawy的线性模型书: round(cor(seatpos[,-9]),2) 我不确定什么[,-9],2在做什么 - 可能有人请帮助?

    1热度

    1回答

    为了从一系列分布(对数正态分布,指数分布,伽马值)中获得p值,并且已经达到了该值,我一直在使用UNIVARIATE过程下面的问题: 我用下面的代码获取的拟合检验善良的p值各分布: ods select all/*ParameterEstimates GoodnessOfFit*/; proc univariate data=results.Parametros_Prueba_1; v

    1热度

    1回答

    给出一组用于训练神经网络的训练示例,我们希望给予训练中各种示例更多或更少的权重。根据示例的“值”(例如有效性或置信度)的一些标准,我们对每个示例应用0.0到1.0之间的权重。这怎么能在Tensorflow中实现,特别是在使用tf.nn.sparse_softmax_cross_entropy_with_logits()时?

    0热度

    1回答

    采样模式我已经从连续分布的采样值,例如: import numpy as np values = np.random.normal(loc=0.4, scale=0.1, 1000) 我怎么能估计基于这样的价值观的模式? 平均数和中位数很容易计算:np.mean(values)和np.median(values);但对于模式我不知道如何估计它,因为这些值是连续的。 请注意,使用诸如scipy

    0热度

    1回答

    在这个binom测试中,样本估计的含义是什么。他们似乎没有改变porbability of success的变化。我试图在文档和Google上找到它的含义,但看不到它。我也试着手动计算它,检查它是否意味着任何事情,但我仍然看不到它的真正含义。 有什么想法? binom.test(60,300,0.3) Exact binomial test data: 60 and 300 number o

    0热度

    1回答

    我使用'dwtest'命令对我的变量运行durbin-watson测试。 有8个独立变量和267个样本。 我得到以下结果,并想知道我是否可以得出结论 我没有自相关问题。如果不是,我应该如何声明? Durbin-Watson test data: y ~ x + x2 + x3 + x4 + x5 + x6 + x7 + x8 DW = 2.816, p-value =