2014-01-08 94 views
0

我有一个文本文件。该特定文本文件的示例内容就像正则表达式提取键值对

root(ROOT-0, good-4)nn(management-2, company-1)nsubj(good-4, management-2) 

现在我需要将它分开并将其存储在ArrayList中。为此我写下面的代码

public class subject { 
public void getsub(String f){ 
    ArrayList <String>ar=new ArrayList<String>(); 
    String a="[a-z]([a-z]-[0-9],[a-z]-[0-9])"; 
    Pattern pattern=Pattern.compile(a); 
    Matcher matcher=pattern.matcher(f); 
    while(matcher.find()){ 
     if(matcher.find()){ 
      ar.add(matcher.group(0)); 
     } 
    } 
    System.out.println(ar.size()); 
    for(int i=0;i<ar.size();i++){ 
     System.out.println(ar.get(i)); 
    } 



} 

} 

但arraylist没有得到填充。这是为什么

回答

3

您在您的Pattern中使用不加引号的括号。

未加引号的括号意味着您的Pattern中的一个组的定义,用于以后的引用。

但是,在这里您试图匹配实际的括号,因此它们需要像这样转义:\\(\\)

对于一个粗略的解决方案,试试这个:

String text = "root(ROOT-0, good-4)nn(management-2, company-1)nsubj(good-4, management-2)"; 
List<String> myPairs = new ArrayList<String>(); 
Pattern p = Pattern.compile(".+?\\(.+?,.+?\\)"); 
Matcher m = p.matcher(text); 
while (m.find()) { 
    myPairs.add(m.group()); 
} 
System.out.println(myPairs); 

输出:

[root(ROOT-0, good-4), nn(management-2, company-1), nsubj(good-4, management-2)] 

最后一点:一种改进的解决方案,我会尝试和使用群体的第一部分区分你Pattern和括号中的实际对,所以在这种情况下建立一个Map<String, ArrayList<String>>作为数据对象 - 但这不在这个答案的范围内。

+0

+1是'this'与答案接近! – PopoFibo

+1

@PopoFibo然后感谢公平竞争:) – Mena

+0

+1太快.. – gowtham