2013-09-24 30 views
1

我正在使用RapidMiner 5.3.013。我正在从一个excel文件中读取来自Remedy的成千上万行工作日志。我想根据正则表达式去除文本^[A-Z][\w\d/?(# ]+[\w0-9#)]{2}:然后使用来自数据的处理文档。到目前为止还没有想出如何做到这一点。我可能只写VBA,但想知道如何在Rapidminer中完成。如何在处理数据之前从示例集中删除文本?

回答

0

读完Excel数据后,请确保Process Documents操作员处理的字段设置为输入文本。使用Nominal to Text运算符执行此操作。在流程文档循环内部,使用Tokenize运算符将数据分成令牌。使用“过滤器令牌”运算符删除您不需要的任何令牌。该运算符将正则表达式作为参数。确保在此运算符上设置了反转标志,以移除您不想要的令牌而不是保留它们

相关问题