statistics

-2热度

2回答

鉴于这种集在Excel中： Group Enrolled Eligible Percent A 0 76 0% B 10 92 11% C 0 38 0% D 2 50 4% E 0 111 0% F 4 86 5% G 3 97 3% H 4 178 2% I 2 77 3% J 0

1热度

1回答

重新编码多个Likert标度 - 任何包？

目前，我正在将我的Likert类型比例重新编码为数字值。但是，我在这个数据集中有很多不同比例的项目。例如：Q2.1_1：Q2.1_16是一个Likert量表，它具有与其他调查不同的关键字。目前，我手动输入每个重新编码是这样的： final$Q2.1_1rc <- as.numeric(recode( final$Q2.1_1, "Very slightly or not at a

0热度

1回答

如何在一个框架中绘制2个正态分布？

这里的问题是： 2组： A组：初始胆固醇水平通常与平均值= 244毫克/ 100毫升和标准偏差= 51毫克/ 100毫升分布。 B组：初始胆固醇水平正态分布，平均值= 219mg/100ml，标准偏差= 41mg/100ml。我需要回答的问题是如何在同一个框架中生成两个正态分布（组A +组B）？我使用命令dnorm()？这里是我的代码尝试： curve(dnorm(x, mean=219,

-1热度

2回答

查找支持向量机分类的最重要功能

我正在训练二元分类器使用python和流行的scikit-learn模块的SVM类。在训练后，我使用predict方法进行分类，如sci-kit's SVC documentation所示。我想知道更多关于我的样本特征对经过训练的decision_function（支持向量）所产生的分类的重要性。欢迎使用这种模型进行预测时评估特征重要性的任何策略。谢谢！ Andre

0热度

1回答

如何申请钾对回归类型的目标变量

from keras.models import Sequential from keras.layers import Dense from keras.wrappers.scikit_learn import KerasClassifier from sklearn.model_selection import StratifiedKFold from sklearn.model_se

1热度

1回答

关于SPSS和MS的统计峰度excel

我使用SPSS作为我的数据集的统计分析工具。我对kurtosis概念以及SPSS和excel生成的概念几乎没有任何疑问。请更正下列理解和后续的问题：峰度作为分配平整度或peakness（驼峰）围绕平均值的度量。就分布尾巴而言，它会告诉数据集是相对于正态分布而言是重尾还是轻尾。正态分布的峰度恰好为3（过度峰度正好为0，即kurt-3），也称为mesokurtic分布。高峭度分布的峰值大于m

0热度

1回答

算法跟踪的相对趋势

我正在一个网站上文章和标签（他们的关系是N：M）。网站的一个重要部分是通过标签过滤文章。这些标签具有某些重量，代表它们的相对重要性。重量随时间变化（每天），取决于它们用于过滤物品的频率（命中））。我应该使用什么算法来计算权重？关键标准：基于历史数据（命中），但相当短期（〜最后10-20 天）过去数据的相关性下降一段时间（从昨天的点击率是更重要比10天前点击）尊重标签的“个人倾向”（即从1

0热度

1回答

找到最大化另一个属性的正确属性

我有一个模型，其中有几个属性/属性是固定的（约15个独立属性）。相同的模型有另一个属性，这是我最感兴趣的属性。我想最大化该属性的某个值。我想找出哪些固定的属性值影响最有趣的属性根据我的数据。我认为这是一个统计问题，但我不确定。一个现实生活中的例子是具有以下所有固定属性的抵押贷款数据库：银行分行，邮政编码，就业，薪水，信用评分，关系状态，子女数量等。然后我有一个属性是抵押贷款是否违约。我想找

0热度

1回答

在Django中每月保存模型字段的值

我需要保存每个月我模型字段的值。我已经看过Celery的计划任务，但我想知道是否有其他方法可以做到这一点？我的代码： class Sales(models.Model): ... sales_objective = models.IntegerField(blank=True, null=True) sales_objective可以从一个月改变为其他，我想再创造一些统计

1热度

1回答

用于计数scipy.stats.binned_statistic_2d工作，但并不意味着

我有一个类似如下（散点图）一些卫星数据：我现在想斌这个数据到规则的网格上时间和纬度，并且每个bin都等于落入其中的所有数据点的平均值。我一直在试验scipy.stats.binned_statistic_2d，并对我所得到的结果感到困惑。首先，如果我将“count”统计信息传递给scipy binning函数，它看起来可以正常工作（最小代码和下图）。 id1 = np.ma.masked_whe