discretization

    1热度

    1回答

    我使用离散RWeka的数据集在R. library(RWeka) m2 <- Discretize(Species ~., data = iris) View(m2) 但是我要输出作为整数矩阵。 例如:包中的所有输出在R中的离散化是整数矩阵。

    0热度

    1回答

    我正在尝试编写一个调用Weka中的CfsSubsetEval类来执行特征子集选择的java程序。 CfsSubsetEval分离数据集,我试图避免这种情况,因为数据集已经离散化了。以下是执行离散化的CfsSubsetEval.java中的行。 m_isNumeric = m_trainInstances.attribute(m_classIndex).isNumeric(); if (!m_i

    1热度

    1回答

    我必须计算连续/数字特征的互信息。我想要应用基于此的功能选择。功能设置说明下面给出 特征1:可以假设1之间的任意值 - 10000 特点2:措施上的东西所花费的时间 - 从而可以承担任何价值,但整数(大) .... 我有这几样特征。 我很困惑应用这方面的互信息公式。维基百科说整合是需要连续变量的。 在申请MI之前是否需要离散化特征?

    5热度

    3回答

    我的数据由连续和分类特征组合而成。下面是我的数据看起来像CSV格式(认为它是由在不同的城市工作专卖店超级连锁店收集的数据) city,avg_income_in_city,population,square_feet_of_store_area, store_type ,avg_revenue NY ,54504 , 3506908 ,3006 ,INDOOR , 8000091

    1热度

    2回答

    我很尴尬地问这个,因为我相信我可能会错过某些明显的东西,但我不知道自己出错的地方。作为一个更大程序的一部分,我正在研究离散化方法在方波上近似对流方程的应用。但是,我注意到,在某些情况下,我的方波的边界被错误地应用。当其他地方的10.25 < = X < = 10.5和0时,它应具有1的初始条件。这是问题的一个示例: L=20; %domain length dx=0.01; %sp

    -1热度

    2回答

    我有这些数据有两列。正如你在图表中看到的那样,数据有太多的噪音。所以,我想要将大小为5的列“r”离散化,并将每一行分配到其对应的bin,然后计算每个bin的f的平均值。 > dr r f 1 65.06919 21.796 2 62.36986 22.836 3 59.81639 22.980 4 57.42822 22.061 5 55.22681 21.012 6

    0热度

    1回答

    因此,我有一个从1到100的值的数组,并且我需要在对每个离散值应用别名时使其离散。例如: A 10 15 55 15 70 现在,让我们说,我希望把它离散超过2个箱(使0-50是一个bin和51-100是另一个),并用1和2的别名这些回收箱。它应该导致: A 1 1 2 1 2 请注意,这是不同于离散功能(包含在熵或infotheo)。该功能只计算每个箱的值的数量。 我

    1热度

    2回答

    随机森林接受数字数据。通常将带有文本数据的要素转换为数字类别,并连续输入数字数据,而不进行离散化处理。 RF如何处理创建节点的连续数据?它会在内部存储连续的数字数据吗?或将每个数据视为离散级别。 例如: 我想给一个数据集(在将文本特征分类之后)提供给RF。 RF如何处理连续数据? 建议在饲喂前离散连续的数据(在这种情况下为经度和纬度)?或者这样做的信息丢失了?

    1热度

    1回答

    离散化Weka中的选定列是可能的吗?我的数据集中有42列,我想离散(仅间隔)只有经度和纬度,但所有列都是离散化的。

    4热度

    3回答

    我使用arules包来离散化数据框中的连续变量。 我使用这个特定的行 离散化(DATA1,类别= 3) 但其给我一个误差在cut.default(X,K2) 错误:K2必须是数字 我只是试图将我的连续变量从“data1”数据框转换为3个bin离散变量。 任何帮助,将不胜感激...谢谢提前