decision-tree

    0热度

    1回答

    我正在制定一个项目,将总统辩论推文分为中立,正面和负面的每个候选人。 (不是当前的辩论数据集)。我正在使用Decision trees,Decision tree ensemble和AdaBoost进行培训。问题是我得到100%的准确性,这是非常奇怪和不可能的。 我拥有的数据是bag-of-words模型的形式。取决于单词是否出现在每条推文中,词汇表中的每个单词由0/1表示。我在问题结尾列入了统计

    1热度

    1回答

    二元响应我现在有一个RDD在那里我有两列这是 Row(pickup_time=datetime.datetime(2014, 2, 9, 14, 51) dropoff_time=datetime.datetime(2014, 2, 9, 14, 58) 我希望将这些转化为二元响应变量,其中1将表明夜间和功能0表示白天。 我知道我们可以使用UserDefinedFunction来创建

    -2热度

    1回答

    我使用的训练数据生成ML决策树。根据我的使用情况,我需要查看决策树以获取有关数据分布的更多详细信息,例如每个节点处的值等。我使用java中的weka生成树,然后使用简单的print语句可以看到树结构,但是weka没有提供任何API来进一步查看树,树只能以String形式提供。我不想解析字符串,是否还有其他可用的库,可以通过正常遍历将树翻译为一组规则? 任何其他基于ML的库可以基于可用的数据生成树,

    -4热度

    1回答

    我能够生成正确的if else循环。但我无法调整缩进。有没有正确缩进它的方法?

    0热度

    1回答

    我试图建立一个二进制决策树和只与目标的75%(或更高)的浓度(是对否) 选择节点只有那些节点75%或更多将得到治疗。 有没有一种方法可以改变决策树的目标,使观察次数最大至少75%是(或其他数字)? 我可以嘲笑一些代码,如果这将有所帮助。

    0热度

    1回答

    export_graphviz(treeclf,out_file = 'tree_titanic.dot',feature_names = feature_cols) 在命令行上,运行此转换为PNG: 点-Tpng tree_titanic.dot -o tree_titanic.png 我正在使用上面的代码,但是当我尝试在终端中运行(点命令)时,它不起作用。我如何在jupyter中运行这个命令来

    1热度

    1回答

    我正在运行SciKit Learn的决策树算法,我想获取Feature_importance向量以及要素名称,以便我可以确定哪些要素在标注过程中占主导地位。你可以帮帮我吗?谢谢。

    0热度

    1回答

    多类决策森林与随机森林有什么不同?他们有什么共同点?似乎网上对此问题没有明确的答案。

    0热度

    1回答

    我有一组从1到50的整数值,我想离散化这个集合以处理范围而不是单个值(它们是决策树的大量数字)。假设我想要的范围是1到25,另一个范围是26到50.我尝试过使用Discretize过滤器,但我没有得到任何工作。 你知道如何在WEKA中做到这一点吗? 预先感谢您

    1热度

    1回答

    我正在用python编写决策树。 tree是具有真分支tb和假分支fb的对象。只有根节点具有属性results。 results是包含节点处的每个目标变量(即因变量)的计数的字典。我正在处理一个二进制分类问题,所以一个例子将是一本字典{0: 25, 1: 9}。 我想创建一个函数findrootnodes(tree),它遍历树遍历到根节点。它应该返回列表根节点。列表中的每个元素都应该包含一个字典。