2012-07-11 118 views
2

我在线学习Java正则表达式教程,并对一个小程序感到困惑。关于查找数字字符串的Java正则表达式

// String to be scanned to find the pattern. 
    String line = "This order was places for QT3000! OK?"; 
    String pattern = "(.*)(\\d+)(.*)"; 

    // Create a Pattern object 
    Pattern r = Pattern.compile(pattern); 

    // Now create matcher object. 
    Matcher m = r.matcher(line); 
    if (m.find()) { 
    System.out.println("Found value: " + m.group(0)); 
    System.out.println("Found value: " + m.group(1)); 
    System.out.println("Found value: " + m.group(2)); 
    } 

并打印出来的结果是:

Found value: This order was places for QT3000! OK? 

Found value: This order was places for QT300 

Found value: 0 

我不知道为什么组(1)获取价值以上的价值?为什么它会在'QT3000'的最后一个零之前停止?

非常感谢!

+0

你在组1人失踪零是正确的,在组2 ... 3组将是'! OK?'。 – cha0site 2012-07-11 14:33:50

+0

Java正则表达式..这听起来很可怕 – gaussblurinc 2012-07-11 14:40:01

回答

2

第一组(.*)(这是索引1-索引0是整体正则表达式)是一个贪婪的匹配。尽可能多地捕捉整体表达仍然匹配。因此,它可能会占用字符串中的第二个0,只留下0以匹配(\\d+)。如果你想要不同的行为,那么你应该阅读贪婪和非贪婪的匹配,或找到一个更合适的模式。

+1

好的,我明白了。这非常有帮助。非常感谢你! – 2012-07-11 14:35:43

0

其实你的组号错了。

集团0永远是整个字符串匹配

第1组是匹配(。*)被称为“贪婪”,因为它会尽可能多的字符可能(符合你的情况“这订的是QT300" 的地方)

第2组是匹配(\ d +),这是可能的最小相匹配的正则表达式(在你的情况下,它是‘0’)

3组(你做不打印)是最后一个(。*)并且应该匹配“!OK”(“?”是一个特殊的正则表达式字符,如果你想匹配它的话,它会与\)

如果你想在3000上的第2组使用此正则表达式匹配:

String pattern = "(.*?)(\\d+)(.*)"; 
+0

是的,您为匹配'3000'提供的模式奏效。现在我明白了'?'的用法以及。谢谢! – 2012-07-11 14:47:31

相关问题