2016-11-22 52 views
1

我做了特征选择后,具有18个维度的特征,并将用于训练分类器,RNN,HMM等。是否有必要在机器学习中规范化/标准化数据?

特征包含stddev,加速度计和陀螺仪的平均值和派生值。 这些功能有不同的单位,规范化/标准化将失去功能的真正含义。

例如,一个特征向量的单位是旋转速度(度/秒),该特征的值在-120和120之间。 另一个是x轴加速度的stddev,该值主要介于0和2. 如果我想做标准化,所有的特征向量都将在0附近居中,负/正值分布在零附近。 - >即使是stddev也会有负值!它完全失去了实际意义?

我在错误的轨道上吗?任何信息表示赞赏!谢谢!

+1

这不适用于SO。反正你有anwser [这里](http://stats.stackexchange.com/questions/189652/is-it-a-good-practice-to-always-scale-normalize-data-for-machine-learning) –

回答

-2

对于执行特征缩放和规范化作为预处理步骤,它甚至会受益于梯度下降(最常见的学习算法),即使在您的情况下它会很有用,但如果您有疑问,您可以执行交叉验证。例如,当使用图像和神经网络时,有时在归一化后特征(像素)变为负值,这不会使训练数据失去意义。

相关问题