statistics

    -2热度

    2回答

    鉴于这种集在Excel中: Group Enrolled Eligible Percent A 0 76 0% B 10 92 11% C 0 38 0% D 2 50 4% E 0 111 0% F 4 86 5% G 3 97 3% H 4 178 2% I 2 77 3% J 0

    1热度

    1回答

    目前,我正在将我的Likert类型比例重新编码为数字值。但是,我在这个数据集中有很多不同比例的项目。例如:Q2.1_1:Q2.1_16是一个Likert量表,它具有与其他调查不同的关键字。目前,我手动输入每个重新编码是这样的: final$Q2.1_1rc <- as.numeric(recode( final$Q2.1_1, "Very slightly or not at a

    0热度

    1回答

    这里的问题是: 2组: A组:初始胆固醇水平通常与平均值= 244毫克/ 100毫升和标准偏差= 51毫克/ 100毫升分布。 B组:初始胆固醇水平正态分布,平均值= 219mg/100ml,标准偏差= 41mg/100ml。 我需要回答的问题是如何在同一个框架中生成两个正态分布(组A +组B)? 我使用命令dnorm()? 这里是我的代码尝试: curve(dnorm(x, mean=219,

    -1热度

    2回答

    我正在训练二元分类器使用python和流行的scikit-learn模块的SVM类。在训练后,我使用predict方法进行分类,如sci-kit's SVC documentation所示。 我想知道更多关于我的样本特征对经过训练的decision_function(支持向量)所产生的分类的重要性。欢迎使用这种模型进行预测时评估特征重要性的任何策略。 谢谢! Andre

    0热度

    1回答

    from keras.models import Sequential from keras.layers import Dense from keras.wrappers.scikit_learn import KerasClassifier from sklearn.model_selection import StratifiedKFold from sklearn.model_se

    1热度

    1回答

    我使用SPSS作为我的数据集的统计分析工具。 我对kurtosis概念以及SPSS和excel生成的概念几乎没有任何疑问。 请更正下列理解和后续的问题: 峰度作为分配平整度或peakness(驼峰)围绕平均值的度量。就分布尾巴而言,它会告诉数据集是相对于正态分布而言是重尾还是轻尾。 正态分布的峰度恰好为3(过度峰度正好为0,即kurt-3),也称为mesokurtic分布。 高峭度分布的峰值大于m

    0热度

    1回答

    我正在一个网站上文章和标签(他们的关系是N:M)。网站的一个重要部分是通过标签过滤文章。这些标签具有某些重量,代表它们的相对重要性。重量随时间变化(每天),取决于它们用于过滤物品的频率(命中))。 我应该使用什么算法来计算权重?关键标准: 基于历史数据(命中),但相当短期(〜最后10-20 天) 过去数据的相关性下降一段时间(从 昨天的点击率是更重要比10天前点击) 尊重标签的“个人倾向”(即从1

    0热度

    1回答

    我有一个模型,其中有几个属性/属性是固定的(约15个独立属性)。 相同的模型有另一个属性,这是我最感兴趣的属性。我想最大化该属性的某个值。 我想找出哪些固定的属性值影响最有趣的属性根据我的数据。我认为这是一个统计问题,但我不确定。 一个现实生活中的例子是具有以下所有固定属性的抵押贷款数据库:银行分行,邮政编码,就业,薪水,信用评分,关系状态,子女数量等。然后我有一个属性是抵押贷款是否违约。 我想找

    0热度

    1回答

    我需要保存每个月我模型字段的值。我已经看过Celery的计划任务,但我想知道是否有其他方法可以做到这一点? 我的代码: class Sales(models.Model): ... sales_objective = models.IntegerField(blank=True, null=True) sales_objective可以从一个月改变为其他,我想再创造一些统计

    1热度

    1回答

    我有一个类似如下(散点图)一些卫星数据: 我现在想斌这个数据到规则的网格上时间和纬度,并且每个bin都等于落入其中的所有数据点的平均值。我一直在试验scipy.stats.binned_statistic_2d,并对我所得到的结果感到困惑。首先,如果我将“count”统计信息传递给scipy binning函数,它看起来可以正常工作(最小代码和下图)。 id1 = np.ma.masked_whe