decision-tree

0热度

1回答

我正在制定一个项目，将总统辩论推文分为中立，正面和负面的每个候选人。（不是当前的辩论数据集）。我正在使用Decision trees,Decision tree ensemble和AdaBoost进行培训。问题是我得到100％的准确性，这是非常奇怪和不可能的。我拥有的数据是bag-of-words模型的形式。取决于单词是否出现在每条推文中，词汇表中的每个单词由0/1表示。我在问题结尾列入了统计

1热度

1回答

创建转换时间变量

二元响应我现在有一个RDD在那里我有两列这是 Row(pickup_time=datetime.datetime(2014, 2, 9, 14, 51) dropoff_time=datetime.datetime(2014, 2, 9, 14, 58) 我希望将这些转化为二元响应变量，其中1将表明夜间和功能0表示白天。我知道我们可以使用UserDefinedFunction来创建

-2热度

1回答

遍历决策树得到的规则集

我使用的训练数据生成ML决策树。根据我的使用情况，我需要查看决策树以获取有关数据分布的更多详细信息，例如每个节点处的值等。我使用java中的weka生成树，然后使用简单的print语句可以看到树结构，但是weka没有提供任何API来进一步查看树，树只能以String形式提供。我不想解析字符串，是否还有其他可用的库，可以通过正常遍历将树翻译为一组规则？任何其他基于ML的库可以基于可用的数据生成树，

-4热度

1回答

我正在写一个代码，它构建了一个决策树并以if-else循环代码的形式吐出了树形结构

我能够生成正确的if else循环。但我无法调整缩进。有没有正确缩进它的方法？

0热度

1回答

决策树更改目标函数

我试图建立一个二进制决策树和只与目标的75％（或更高）的浓度（是对否）选择节点只有那些节点75％或更多将得到治疗。有没有一种方法可以改变决策树的目标，使观察次数最大至少75％是（或其他数字）？我可以嘲笑一些代码，如果这将有所帮助。

0热度

1回答

如何在Jupyter笔记本中打印决策树分类器？

export_graphviz（treeclf，out_file = 'tree_titanic.dot'，feature_names = feature_cols）在命令行上，运行此转换为PNG：点-Tpng tree_titanic.dot -o tree_titanic.png 我正在使用上面的代码，但是当我尝试在终端中运行（点命令）时，它不起作用。我如何在jupyter中运行这个命令来

1热度

1回答

SciKit决策树中的Feature_importance向量与功能名称一起学习

我正在运行SciKit Learn的决策树算法，我想获取Feature_importance向量以及要素名称，以便我可以确定哪些要素在标注过程中占主导地位。你可以帮帮我吗？谢谢。

0热度

1回答

多类决策森林vs随机森林

多类决策森林与随机森林有什么不同？他们有什么共同点？似乎网上对此问题没有明确的答案。

0热度

1回答

我如何离散WEKA中的一组值？

我有一组从1到50的整数值，我想离散化这个集合以处理范围而不是单个值（它们是决策树的大量数字）。假设我想要的范围是1到25，另一个范围是26到50.我尝试过使用Discretize过滤器，但我没有得到任何工作。你知道如何在WEKA中做到这一点吗？预先感谢您

1热度

1回答

决策树中的递归编程

我正在用python编写决策树。 tree是具有真分支tb和假分支fb的对象。只有根节点具有属性results。 results是包含节点处的每个目标变量（即因变量）的计数的字典。我正在处理一个二进制分类问题，所以一个例子将是一本字典{0: 25, 1: 9}。我想创建一个函数findrootnodes(tree)，它遍历树遍历到根节点。它应该返回列表根节点。列表中的每个元素都应该包含一个字典。