0

我正在使用Weka的NaiveBayes分类器。有些事我听说过,我不确定它是否属实。有人告诉我,当我有数值时,数值越高,权重就越高。是对的吗?数值对于weka意味着什么

我的意思是,如果第一个实例的feature1(数字)的值为1,而第二个实例的该特征的值为2,是否意味着第二个实例必须具有该特征的较高权重?

如果这是正确的,我应该怎么做,如果我想改变它?

例如,我已经定义了一个距离特征。但是,越接近越好,这意味着此功能的较低值必须具有较高的权重。

我应该如何在Weka中实现它?

感谢

+0

你是什么意思的“重量”?它意味着某些特定的分类器,但它不可能是你在这里的意思。 –

+0

@SeanOwen,当我有明确的价值,Weka给我这样的东西: 猫1:频率20,体重:20 猫2:频率30,体重:30 我认为这意味着一个类别的权重是相同的作为其频率。我的理解是正确的吗? 现在,我想知道这些权重如何与数字特征。 Weka如何权衡一个特征的数值。有没有类似于分类功能的东西?特征的值2的权重是否大于值1? – user1419243

回答

0

如果我理解正确的话,你是问你是否需要改变你的特征值,从而转化价值是成正比的预测。这取决于你选择的学习算法,它与Weka无关。对于大多数学习算法,如回归或决策树,您不需要应用这种逆变换。通常情况下,我会将值保持原样,除非算法需要其他标准化(例如重新缩放或重新归零)为零。