我对RegEx一般来说还是一个新手。我试图从字段中检索名称,以便将它们拆分以供进一步使用(使用Pentaho Data Integration/Kettle进行数据提取)。下面是我给出的字符串的示例:RegEx删除不需要的文本
CN=Name One/OU=Site/O=Domain;CN=Name Two/OU=Site/O=Domain;CN=Name Three/OU=Site/O=Domain
我想有以下格式返回:
Name One;Name Two;Name Three
水壶使用Java正则表达式。
在PDI的另一个步骤中,我将能够拆分数据。只想做最初的清洁。 – OpenDataAlex 2010-09-10 14:19:04
我刚刚检查了http://wiki.pentaho.com/display/EAI/Regex+Evaluation上的文档 - 它看起来像他们的正则表达式替换的东西是相当有限的。你想得到一个单一名称的正则表达式是CN =([^ \ /] *),但是我没有看到用“g”lobal标志来获得所有名字的选项。 - 您可以尝试:(CN =([^ /] *)[^;] *;)*,然后为捕获组启用创建字段。 – Sec 2010-09-10 14:29:21
最后一个exp给我留下了最后一个分号后面的文字。去那里虽然= p – OpenDataAlex 2010-09-10 14:49:50