2013-03-01 26 views
0

我需要一个最佳正则表达式来匹配文本文件中的所有这三种类型的文本。单一正则表达式不适用于三种不同的模式

  1. [TRUE,FALSE]
  2. [4,5,6,7]
  3. [2-15]

我试图未工作

以下的正则表达式匹配
m/([0-9A-Fa-fx,]+)\s*[-~,]\s*([0-9A-Fa-fx,]+)/) 
+1

你说的意思是'不working'? – Toto 2013-03-01 12:29:03

+0

TRUE中的T,R和U与您的正则表达式不匹配 – orique 2013-03-01 12:29:25

回答

2

4-72-15的子集。此正则表达式应该捕捉它们:

/TRUE|FALSE|[2-9]|1[0-5]/ 
+0

我不明白这可能与'[4,5,6,7]'匹配。我的意思是,它确实匹配,但只有第一个小数。我认为你对(不完整)问题描述的解释太过分了。 – memowe 2013-03-01 15:09:07

3
/ 
    (?(DEFINE) 
     (?<WORD> [a-zA-Z]+) 
     (?<NUM> [0-9]+) 
    ) 

    \[ \s* 
    (?: (?&WORD) (?: \s* , \s* (?&WORD))+ 
    | (?&NUM) (?: \s* , \s* (?&NUM))+ 
    | (?&NUM) \s* - \s* (?&NUM) 
    ) 
    \s* \] 
/x 
+0

Upvote命名捕获。但是5.10+。 – rjh 2013-03-01 13:13:06

+0

@rjh,如果要避免5.10特征,可以将定义内联,但如果要进行更改,则必须在两个或四个位置编辑定义。 – ikegami 2013-03-01 14:35:18

0

一个quick'n'dirty测试程序:

#!/usr/bin/env perl 

use strict; 
use warnings; 

for my $line (<DATA>) { 

    chomp $line; 
    print "$line: "; 

    if ($line =~/
      ^         # beginning of the string 
      \[         # a literal opening sq. bracket 
      (         # alternatives: 
        (TRUE|FALSE) (,(TRUE|FALSE))*  # one or more thruth words 
       | (\d+) (,\d+)*      # one or more numbers 
       | (\d+) - (\d+)      # a range of numbers 
      )         # end of alternatives 
      \]         # a literal closing sq. bracket 
      $         # end of the string 
     /x) { 

     print "match\n"; 
    } 
    else { 
     print "no match\n"; 
    } 
} 

__DATA__ 
[TRUE] 
foo 
[FALSE,TRUE,FALSE] 
[FALSE,TRUE,] 
[42,FALSE] 
[17,42,666] 
bar 
[17-42] 
[17,42-666] 

输出:

[TRUE]: match 
foo: no match 
[FALSE,TRUE,FALSE]: match 
[FALSE,TRUE,]: no match 
[42,FALSE]: no match 
[17,42,666]: match 
bar: no match 
[17-42]: match 
[17,42-666]: no match 
相关问题