rapidminer

    0热度

    1回答

    Rapidminer提取物#标签我有一个CSV文件中的一些数据的鸣叫,我想(1)只提取主题标签(有特殊字符,如##云计算,#cloud_computing,#101Cloud等,并考虑多个案例表示(#edtech,#Edtech,#EdTech等)中的一个#标签,(2)基于主题标签对推文进行分组,并且(3)对每个主题标签词语出现在文档或文档中的次数进行计数。我知道我必须在'Title'列的Filt

    0热度

    1回答

    我想通过在trainData上训练它然后在testData上进行测试来使用神经网络,因为任何人都会这样做。但是,这些数据需要对某些标称特征进行虚拟编码才能得到数值。当我这样做时,它会训练神经网络,但由于虚拟编码*中的不匹配,将其应用于测试数据(我在其上应用完全相同的变换/块)时会失败。 *该错误消息中的线:V47 = H不TESTDATA存在 我检查和这是事实,TESTDATA确实不在所有在V47

    0热度

    1回答

    对不起,如果这是一个非常新手问的问题但我最近开始探索Rapidminer。我用它来聚类我的样本数据[使用K均值聚类]。我的查询是如果我使用Excel原始数据文件进行群集,我将如何将我的Excel数据返回[输出数据]分成Excel文件中的K个群集。我知道如何创建集群并在设计和结果屏幕之间切换。 在此先感谢。

    0热度

    1回答

    我已经使用批处理验证创建了模型,是否有将此模型应用于非批处理数据的方法? 这里是我创建的示例过程: <?xml version="1.0" encoding="UTF-8" standalone="no"?> <process version="7.0.001"> <context> <input/> <output/> <macros/> </context> <operator

    0热度

    3回答

    我有一个具有10个属性的数据集,那么我想减少数据集中的属性,我想应用遗传算法,但我有一点点对这个概念感到困惑,所以你可以给我任何例子。

    0热度

    1回答

    我收到了一些rapidminer的ExampleSets格式的实验数据。数据以包含多个“数据条目”的单个存储库呈现(不确定正确的术语)。将其导出为更方便的格式以保存文件夹结构和命名最简单的方法是什么? 我知道如何单个文件导出与创建一个过程,即由检索库,写CSV,写文件。因为我有很多存储库/文件,所以对我来说并不真实。 循环库应该适合,但我不知道如何自动设置文件名为写文件。 我能想到的另一个选择是自

    0热度

    1回答

    我在Mac OSX平台上使用RapidMiner Studio 7.0.001。 使用分割数据运算符时,我发现它始终为我的数据生成相同的分割。我没有使用局部随机种子,所有采样类型都有相同的问题。 任何帮助表示赞赏。

    0热度

    2回答

    我已经下载了关系数据集,并且我想使用Rapidminer提取频繁模式和关联规则。我的问题是可以挖掘哪种数据来提取关联规则和频繁模式,关系或交易或...? 我尝试从我的关系数据集生成频繁模式,但Rapidminer错误的属性应该只是二项式?

    -2热度

    2回答

    我知道一些分类算法,如决策树,但我不能用它们中的任何一个来解决我手头的问题。 我有一个数据集,其中每行包含购买信息。它的栏目有: - customer id - store id where the purchase took place - date and time of the event - amount of money spent 我试图做的是,给定的谁,何时何地,预测多少钱

    0热度

    2回答

    我需要知道如果在其他命令窗口中打开的第二个批处理文件已停止(等待参数或进程不成功),我该如何检查批处理文件。 @echo off :loop start /wait rapidminer-batch.bat -f C:\Users\AHM-PC\Documents\ccc.rmp echo cmd stopped pause goto loop