2012-10-11 58 views
1

众所周知,的特征构成特征向量,需要更多数量的样本来训练分类器。在我的情况下,我在一个两级问题中使用一个反向传播多层感知器,其中大约有256个特征组成一个特征向量。样本大小和特征向量维度之间的经验法则是什么?

现在我的样本量不是无限的。约2000个正面和2000个负面样本。

在制定一些降维程序和所有这些之前,我想知道是否有任何这样的关系。样品和没有。特征向量中的维数。

回答

2

这两者之间没有实际的直接关系,因为必要数量的训练数据也取决于模型的复杂性和所用的训练程序。

从实际的角度来看,我会建议先运行一个简单的区别性分类器,看看它如何与所有的功能一起工作,然后可能应用某种特征选择。

+0

soufanom,这不是关于求解方程组,真的。此外,即使特征的数量显着超过训练样本的数量,有时也可能找到一个好的分类器。 – Qnan

相关问题