0
我有一些意见,我想分类为正面或负面。 到目前为止,我有一个带注释的数据集。相同的测试集
事情是,前100行被归类为正面,其余100个归类为负面。
我正在使用SQL Server Analysis-2008 R2。 Class属性有2个值,POS为正值,NEG为负值。
此外,我使用最大输入/输出属性= 0(希望使用所有属性)进行分类的朴素贝叶斯算法,将测试集的最大情况设置为30%。升降图目前的得分是0.60。
我必须将它们混合起来,例如2 POS,然后是1 NEG,以获得更好的分类准确性?
我允许算法自动选择代表更好数据的特征,并且得到了0.77的分数 我认为您拥有的属性越多越好。 – BinariOS
更多属性并不总是更好。自然地,存在太多属性会使问题难以解决的折衷(例如,较大的搜索空间),尤其是如果一些不太有用,但是太少可能低代表数据。 – user2683129