2014-02-21 24 views
2

我是antlr的新手,并且正在为DSL编写antlr语法。我跳过了空白处理它。但在这里我想可选语法我拿起一个特定的令牌可能,我想在这里实现的方式白色space.The事情的情况下被允许我的antlr语法令牌中的空白

  1. 令牌SECATTR 有空格与修剪尾随和领导spaces.That是一样的东西
    AA aa_aa aa.aa aa_aa AA没有解析规则 的排序COUNT(aa aa_aa aa.aa aa_aa aa )>10 singlerule使用时导致空间被理解为单一标记。 截至目前正在形成的树就像是 The token SECATTR having spaces in lead

  2. 解决我的分析规则有空间的问题singleruleCOUNT (aa aa_aa aa.aa aa_aa aa)>10COUNT这就好比single rule with spaces抛出一个错误,由于空间

  3. 避免笨拙解析(如果实现)我的令牌SECATTR,因为它目前以下列方式被解析为AA AA _aa aa.aa aa_aa AA(我认为这是一切的根本原因)Multiple breakdown of SECATTR

我需要处理所有这些空格的认​​真,因为我的其他解析规则EXPR是复杂的,基于singlerule和我的最终目标是让干净的方式允许标记的SECATTR有空白和所有其他地方whitespaces被忽略。请建议我在哪里出错,需要改进的地方。

grammar Test; 

options { 
    language = Java; 
} 


fragment DIVIDE : '/'; 
fragment PLUS : '+'; 
fragment MINUS : '-'; 
fragment STAR : '*'; 
fragment MOD : '%'; 
LPAREN : '('; 
RPAREN : ')'; 
fragment COMMA : ','; 
fragment COLON : ':'; 
fragment LANGLEBRACKET : '<'; 
fragment RANGLEBRACKET : '>'; 
fragment EQ : '='; 
fragment NOT : '!'; 
fragment UNDERSCORE : '_'; 
fragment DOT : '.'; 
fragment GRTRTHANEQTO : RANGLEBRACKET EQ; 
fragment LESSTHANEQTO : LANGLEBRACKET EQ; 
fragment NOTEQ  : NOT EQ; 

WS  :   ('\t'|'\f'|'\n'|'\r'|' ')+{ $channel=HIDDEN; }; 

fragment A:('a'|'A'); 
fragment B:('b'|'B'); 
fragment C:('c'|'C'); 
fragment D:('d'|'D'); 
fragment E:('e'|'E'); 
fragment F:('f'|'F'); 
fragment G:('g'|'G'); 
fragment H:('h'|'H'); 
fragment I:('i'|'I'); 
fragment J:('j'|'J'); 
fragment K:('k'|'K'); 
fragment L:('l'|'L'); 
fragment M:('m'|'M'); 
fragment N:('n'|'N'); 
fragment O:('o'|'O'); 
fragment P:('p'|'P'); 
fragment Q:('q'|'Q'); 
fragment R:('r'|'R'); 
fragment S:('s'|'S'); 
fragment T:('t'|'T'); 
fragment U:('u'|'U'); 
fragment V:('v'|'V'); 
fragment W:('w'|'W'); 
fragment X:('x'|'X'); 
fragment Y:('y'|'Y'); 
fragment Z:('z'|'Z'); 


OP1 : ((C O U N T | A V G | C O U N T D I S T I N C T) 
     | C A S T) ; 

OP2 : DIVIDE|PLUS|MINUS|STAR|MOD 
     |LANGLEBRACKET|RANGLEBRACKET|EQ|GRTRTHANEQTO|LESSTHANEQTO|NOTEQ 
     |E Q U A L S | L I K E | N O T E Q U A L S | N O T L I K E | N O T N U L L; 

OP3 : ((C O R R E S P O N D I N G | A N Y)|I); 
OP4 : (A N D | O R); 

DIGIT : ('0'..'9')+; 
fragment Letter : ('a'..'z' | 'A'..'Z')+; 
fragment Space : ' '+; 
SECATTR :Letter (Letter|UNDERSCORE|DOT|Space)+ 
     ; 


singlerule : SECATTR OP2 (DIGIT|Letter) 
       | OP1 LPAREN SECATTR RPAREN OP2 (DIGIT|Letter) 
       | SECATTR OP2 SECATTR 
       | OP1 LPAREN SECATTR RPAREN OP2 OP1 LPAREN SECATTR RPAREN 
; 
expr :((LPAREN? singlerule RPAREN?) OP4?)+ 
     |((LPAREN (LPAREN singlerule RPAREN) OP4 (LPAREN singlerule RPAREN) RPAREN)+ (OP4 (LPAREN? singlerule RPAREN?))+ OP4?)+ 
     | (LPAREN (LPAREN singlerule RPAREN) OP4 (LPAREN singlerule RPAREN) RPAREN OP3)+; 

回答

0

ANTLR 3和4具有称为令牌通道的功能。您可以将您的空白/评论等发送到不同频道的解析器。它们在令牌流中供使用,但不被解析器解析。

+1

请您详细说明一下吗?我很抱歉,我是新来的ANTLR –

+0

https://theantlrguy.atlassian.net/wiki/display/ANTLR4/Lexer+Rules#LexerRules-channel() –

+1

我想我通过做'{$ channel = HIDDEN; };' –