保留文本结构信息 - pyparsing

使用pyparsing，有没有一种方法来提取您在递归下降过程中的上下文。让我解释我的意思。我有以下代码：保留文本结构信息 - pyparsing

import pyparsing as pp 

openBrace = pp.Suppress(pp.Literal("{")) 
closeBrace = pp.Suppress(pp.Literal("}")) 
ident = pp.Word(pp.alphanums + "_" + ".") 
comment = pp.Literal("//") + pp.restOfLine 
messageName = ident 
messageKw = pp.Suppress(pp.Keyword("msg")) 
text = pp.Word(pp.alphanums + "_" + "." + "-" + "+") 
otherText = ~messageKw + pp.Suppress(text) 
messageExpr = pp.Forward() 
messageExpr << (messageKw + messageName + openBrace + 
       pp.ZeroOrMore(otherText) + pp.ZeroOrMore(messageExpr) + 
       pp.ZeroOrMore(otherText) + closeBrace).ignore(comment) 
testStr = "msg msgName1 { some text msg msgName2 { some text } some text }" 
print messageExpr.parseString(testStr)

产生以下输出：['msgName1', 'msgName2']

在输出中，我想跟踪嵌入匹配的结构的。我的意思是说，例如，我想用上面的测试字符串输出以下输出：['msgName1', 'msgName1.msgName2']以跟踪文本中的层次结构。然而，我是pyparsing的新手，尚未找到一种方法来提取“msgName2”嵌入在“msgName1”结构中的事实。

有没有办法使用ParserElement的setParseAction()方法来做到这一点，或者使用命名结果？

有用的建议，将不胜感激。

来源

2016-08-07 XYZ

附加解析动作'messageName'这个名字推到外部堆栈，并将一个分析操作附加到closeBrace上，以便将该姓氏从堆栈中弹出。在第一个解析操作中，在将当前名称推入堆栈后，可以用'tokens [0] ='。'。join（stack）'替换输入标记中的名称。 – PaulMcG

感谢Paul McGuire的忠告。下面是我做这解决了这个问题的增加/修改，：

msgNameStack = [] 

def pushMsgName(str, loc, tokens): 
    msgNameStack.append(tokens[0]) 
    tokens[0] = '.'.join(msgNameStack) 

def popMsgName(str, loc, tokens): 
    msgNameStack.pop() 

closeBrace = pp.Suppress(pp.Literal("}")).setParseAction(popMsgName) 
messageName = ident.setParseAction(pushMsgName)

这里是完整的代码：

import pyparsing as pp 

msgNameStack = [] 


def pushMsgName(str, loc, tokens): 
    msgNameStack.append(tokens[0]) 
    tokens[0] = '.'.join(msgNameStack) 


def popMsgName(str, loc, tokens): 
    msgNameStack.pop() 

openBrace = pp.Suppress(pp.Literal("{")) 
closeBrace = pp.Suppress(pp.Literal("}")).setParseAction(popMsgName) 
ident = pp.Word(pp.alphanums + "_" + ".") 
comment = pp.Literal("//") + pp.restOfLine 
messageName = ident.setParseAction(pushMsgName) 
messageKw = pp.Suppress(pp.Keyword("msg")) 
text = pp.Word(pp.alphanums + "_" + "." + "-" + "+") 
otherText = ~messageKw + pp.Suppress(text) 
messageExpr = pp.Forward() 
messageExpr << (messageKw + messageName + openBrace + 
       pp.ZeroOrMore(otherText) + pp.ZeroOrMore(messageExpr) + 
       pp.ZeroOrMore(otherText) + closeBrace).ignore(comment) 

testStr = "msg msgName1 { some text msg msgName2 { some text } some text }" 
print messageExpr.parseString(testStr)

来源

2016-08-07 14:40:26 XYZ

保留文本结构信息 - pyparsing

回答

相关问题