discretization

1热度

1回答

我使用离散RWeka的数据集在R. library(RWeka) m2 <- Discretize(Species ~., data = iris) View(m2) 但是我要输出作为整数矩阵。例如：包中的所有输出在R中的离散化是整数矩阵。

0热度

1回答

在Weka中，如何停止离散化训练实例的CfsSubsetEval？

我正在尝试编写一个调用Weka中的CfsSubsetEval类来执行特征子集选择的java程序。 CfsSubsetEval分离数据集，我试图避免这种情况，因为数据集已经离散化了。以下是执行离散化的CfsSubsetEval.java中的行。 m_isNumeric = m_trainInstances.attribute(m_classIndex).isNumeric(); if (!m_i

1热度

1回答

连续/数字特征的相互信息

我必须计算连续/数字特征的互信息。我想要应用基于此的功能选择。功能设置说明下面给出特征1：可以假设1之间的任意值 - 10000 特点2：措施上的东西所花费的时间 - 从而可以承担任何价值，但整数（大） .... 我有这几样特征。我很困惑应用这方面的互信息公式。维基百科说整合是需要连续变量的。在申请MI之前是否需要离散化特征？

5热度

3回答

如何对sklearn中的连续属性进行离散化？

我的数据由连续和分类特征组合而成。下面是我的数据看起来像CSV格式（认为它是由在不同的城市工作专卖店超级连锁店收集的数据） city,avg_income_in_city,population,square_feet_of_store_area, store_type ,avg_revenue NY ,54504 , 3506908 ,3006 ,INDOOR , 8000091

1热度

2回答

不正确的方波波形

我很尴尬地问这个，因为我相信我可能会错过某些明显的东西，但我不知道自己出错的地方。作为一个更大程序的一部分，我正在研究离散化方法在方波上近似对流方程的应用。但是，我注意到，在某些情况下，我的方波的边界被错误地应用。当其他地方的10.25 < = X < = 10.5和0时，它应具有1的初始条件。这是问题的一个示例： L=20; %domain length dx=0.01; %sp

-1热度

2回答

R计算对应于另一列的每个格的一列的平均值

我有这些数据有两列。正如你在图表中看到的那样，数据有太多的噪音。所以，我想要将大小为5的列“r”离散化，并将每一行分配到其对应的bin，然后计算每个bin的f的平均值。 > dr r f 1 65.06919 21.796 2 62.36986 22.836 3 59.81639 22.980 4 57.42822 22.061 5 55.22681 21.012 6

0热度

1回答

R中的离散化和混叠

因此，我有一个从1到100的值的数组，并且我需要在对每个离散值应用别名时使其离散。例如： A 10 15 55 15 70 现在，让我们说，我希望把它离散超过2个箱（使0-50是一个bin和51-100是另一个），并用1和2的别名这些回收箱。它应该导致： A 1 1 2 1 2 请注意，这是不同于离散功能（包含在熵或infotheo）。该功能只计算每个箱的值的数量。我

1热度

2回答

Scikit学习 - 随机森林：如何处理连续特征？

随机森林接受数字数据。通常将带有文本数据的要素转换为数字类别，并连续输入数字数据，而不进行离散化处理。 RF如何处理创建节点的连续数据？它会在内部存储连续的数字数据吗？或将每个数据视为离散级别。例如：我想给一个数据集（在将文本特征分类之后）提供给RF。 RF如何处理连续数据？建议在饲喂前离散连续的数据（在这种情况下为经度和纬度）？或者这样做的信息丢失了？

1热度

1回答

weka中的选定列离散化

离散化Weka中的选定列是可能的吗？我的数据集中有42列，我想离散（仅间隔）只有经度和纬度，但所有列都是离散化的。

4热度

3回答

R与arules包离散化

我使用arules包来离散化数据框中的连续变量。我使用这个特定的行离散化（DATA1，类别= 3）但其给我一个误差在cut.default（X，K2）错误：K2必须是数字我只是试图将我的连续变量从“data1”数据框转换为3个bin离散变量。任何帮助，将不胜感激...谢谢提前