2016-08-07 60 views
4

使用pyparsing,有没有一种方法来提取您在递归下降过程中的上下文。让我解释我的意思。我有以下代码:保留文本结构信息 - pyparsing

import pyparsing as pp 

openBrace = pp.Suppress(pp.Literal("{")) 
closeBrace = pp.Suppress(pp.Literal("}")) 
ident = pp.Word(pp.alphanums + "_" + ".") 
comment = pp.Literal("//") + pp.restOfLine 
messageName = ident 
messageKw = pp.Suppress(pp.Keyword("msg")) 
text = pp.Word(pp.alphanums + "_" + "." + "-" + "+") 
otherText = ~messageKw + pp.Suppress(text) 
messageExpr = pp.Forward() 
messageExpr << (messageKw + messageName + openBrace + 
       pp.ZeroOrMore(otherText) + pp.ZeroOrMore(messageExpr) + 
       pp.ZeroOrMore(otherText) + closeBrace).ignore(comment) 
testStr = "msg msgName1 { some text msg msgName2 { some text } some text }" 
print messageExpr.parseString(testStr) 

产生以下输出:['msgName1', 'msgName2']

在输出中,我想跟踪嵌入匹配的结构的。我的意思是说,例如,我想用上面的测试字符串输出以下输出:['msgName1', 'msgName1.msgName2']以跟踪文本中的层次结构。然而,我是pyparsing的新手,尚未找到一种方法来提取“msgName2”嵌入在“msgName1”结构中的事实。

有没有办法使用ParserElementsetParseAction()方法来做到这一点,或者使用命名结果?

有用的建议,将不胜感激。

+1

附加解析动作'messageName'这个名字推到外部堆栈,并将一个分析操作附加到closeBrace上,以便将该姓氏从堆栈中弹出。在第一个解析操作中,在将当前名称推入堆栈后,可以用'tokens [0] ='。'。join(stack)'替换输入标记中的名称。 – PaulMcG

回答

2

感谢Paul McGuire的忠告。下面是我做这解决了这个问题的增加/修改,:

msgNameStack = [] 

def pushMsgName(str, loc, tokens): 
    msgNameStack.append(tokens[0]) 
    tokens[0] = '.'.join(msgNameStack) 

def popMsgName(str, loc, tokens): 
    msgNameStack.pop() 

closeBrace = pp.Suppress(pp.Literal("}")).setParseAction(popMsgName) 
messageName = ident.setParseAction(pushMsgName) 

这里是完整的代码:

import pyparsing as pp 

msgNameStack = [] 


def pushMsgName(str, loc, tokens): 
    msgNameStack.append(tokens[0]) 
    tokens[0] = '.'.join(msgNameStack) 


def popMsgName(str, loc, tokens): 
    msgNameStack.pop() 

openBrace = pp.Suppress(pp.Literal("{")) 
closeBrace = pp.Suppress(pp.Literal("}")).setParseAction(popMsgName) 
ident = pp.Word(pp.alphanums + "_" + ".") 
comment = pp.Literal("//") + pp.restOfLine 
messageName = ident.setParseAction(pushMsgName) 
messageKw = pp.Suppress(pp.Keyword("msg")) 
text = pp.Word(pp.alphanums + "_" + "." + "-" + "+") 
otherText = ~messageKw + pp.Suppress(text) 
messageExpr = pp.Forward() 
messageExpr << (messageKw + messageName + openBrace + 
       pp.ZeroOrMore(otherText) + pp.ZeroOrMore(messageExpr) + 
       pp.ZeroOrMore(otherText) + closeBrace).ignore(comment) 

testStr = "msg msgName1 { some text msg msgName2 { some text } some text }" 
print messageExpr.parseString(testStr)