我有一个数据集,包含来自A类的50%实例和B类的50%实例。我想将我的数据集分成一个训练集和一个测试集。我知道RemovePercentage过滤器存在,但它不关心类平衡。我如何从我的数据集中删除35%,但仍然保持训练集中的50/50类分布?如何从Weka中的数据集中删除百分比但保持课程平衡?
0
A
回答
0
好吧,我发现使用过滤StratifiedRemoveFolds道:
步骤1
打开你的数据在Weka的浏览器设置,并选择监督实例过滤StratifiedRemoveFolds。
步骤2
决定你想为你的训练和测试集的大小。如果您希望自己的尺寸相同,请选择numFolds 2.应用过滤器。这将生成一个包含原始集合中50%数据的数据集。 (如果你想67个%列车数据和33%的测试数据然后挑选3 numFolds)
步骤3
保存此生成设定为F.E. “train.arff”。当第一组保存时,您必须撤消该操作,以便您返回完整的数据集。
步骤4
点击StratifiedRemoveFolds过滤器,从错误更改参数invertSelection为True。现在,当您应用该过滤器时,将会像第2步一样生成一个集合,但它将包含另一个50%的数据集合。
步骤5
保存此为“test.arff **。现在你有一列火车和测试集,尊重你的职业平衡。
0
看看Stratified删除折叠。它力求保持原始的类别分布。 http://weka.sourceforge.net/doc.stable/weka/filters/supervised/instance/StratifiedRemoveFolds.html
相关问题
- 1. 从数据框中删除百分比
- 2. 如何平衡剩余的百分比?
- 3. 如何分类weka中的不平衡数据?
- 4. weka中的不平衡数据集?不起作用
- 5. 如何衡量百分比与数量?
- 6. 如何衡量百分比比聚集更大的画面
- 7. 从数组中删除一些百分比的元素
- 8. 保存到Android Pay:如何从Mechant中心删除课程
- 9. 如何从数据集中删除
- 10. 如何删除小数点并在PieChart值中保留百分比?
- 11. MPAndroidChart PieChart删除百分比
- 12. JavaFX:从ProgressIndicator删除百分比
- 13. 删除比数据帧第95百分更大的数据
- 14. 从MySQL表中的值中删除百分比符号
- 15. 如何从Google Analytics自定义报告中删除总数的百分比
- 16. 课程成绩和百分比
- 17. Weka重新取样以平衡二进制数据集中的实例
- 18. 如何在WEKA中设置参数以平衡SMOTE过滤器的数据?
- 19. 在大熊猫数据框中删除行数据占总数的百分比
- 20. 在百分比字段类型中删除百分号
- 21. 如何根据百分比划分数据集?
- 22. SSRS的百分比 - 两个数据集
- 23. JS中的数学 - 如何从百分比中获得比率
- 24. 删除数据库中的项目,但保持唯一ID
- 25. 如何在R中创建平衡训练和不平衡测试数据集?
- 26. BIML中的平衡数据分销商
- 27. 如何衡量代码库中的百分比差异?
- 28. 在weka中拆分数据集
- 29. 平均百分比
- 30. 如何删除数据透视表头,但保持功能
它可以生成采用分层删除褶皱测试集但是这些实例并未从整个数据集中删除,所以我的训练集仍然包含测试集中的实例。 – Stanko