2014-02-16 32 views
6

我使用NLTK和Maltparser从自然语言中的句子中提取依赖关系。我没有使用斯坦福解析器使用此代码一些实验:使用NLTK和MaltParser的依赖关系解析器

sentence = '''I shot an elephant in my pajamas''' 
os.popen("echo '"+sentence+"' > ~/stanfordtemp.txt") 
parser_out = os.popen("/usr/local/Cellar/stanford-parser/2.0.3/bin/lexparser.sh ~/stanfordtemp.txt").readlines() 

for i, tag in enumerate(parser_out): 
    if len(tag.strip()) > 0 and tag.strip()[0] == '(': 
     parse = " ".join(tag.strip()) 
     print i, "Parse: ", tag 
    elif len(tag.strip()) > 0: 
     print i, "Typed dependencies: ", tag 
bracketed_parse = " ".join([tag.strip() for tag in parser_out if len(tag.strip()) > 0 and tag.strip()[0] == "("]) 
print bracketed_parse 

,并有这样好的结果:

Parsing [sent. 1 len. 7]: I shot an elephant in my pajamas 

Parsed 7 words in 1 sentences (12,87 wds/sec; 1,84 sents/sec). 
0 Parse: (ROOT 
1 Parse: (S 
2 Parse:  (NP (PRP I)) 
3 Parse:  (VP (VBD shot) 
4 Parse:  (NP (DT an) (NN elephant)) 
5 Parse:  (PP (IN in) 
6 Parse:   (NP (PRP$ my) (NNS pajamas)))))) 
8 Typed dependencies: nsubj(shot-2, I-1) 
9 Typed dependencies: root(ROOT-0, shot-2) 
10 Typed dependencies: det(elephant-4, an-3) 
11 Typed dependencies: dobj(shot-2, elephant-4) 
12 Typed dependencies: poss(pajamas-7, my-6) 
13 Typed dependencies: prep_in(shot-2, pajamas-7) 

随着MaltParser我有这样的代码:

os.environ['MALTPARSERHOME']="/Applications/maltparser-1.7.2" 
maltParser = nltk.parse.malt.MaltParser(working_dir="/Applications/maltparser-1.7.2", 
             mco="engmalt.linear-1.7", 
             additional_java_args=['-Xmx1024m']) 
txt = '''I shot an elephant in my pajamas''' 
graph = maltParser.raw_parse(txt) 
print(graph.tree().pprint()) 

和后续输出:

(pajamas (shot I) an elephant in my) 

问题:我可以使用与使用斯坦福解析器时相同的输出吗?任何帮助都会很棒。

+0

嘿你找到任何方法吗? –

+0

没有不幸的不是! – Marcelo

回答

1

在MALT文档中查找我没有看到与100%匹配的显示的详细斯坦福分析器输出的选项,但您可以尝试使用connlx和connlu输出选项来查看他们是否具有您的信息需要。

http://www.maltparser.org/options.html

原则上,非投影依赖性分析可以通过MALT输出的转变,这将使你没有太多的精力包围,但标签的构成要件将再次阐述为一个选区分析很多工作。