2016-08-24 38 views
0

我最近发现(阅读下面的问题),我可以使用NNDependencyParser获得与斯坦福分析器的德语依赖关系。Stanford-NLP德语依赖分析不能正常工作

Dependencies are null with the German Parser from Stanford CoreNLP

我的问题是,我的分析依赖性总是简单地相邻的单词在句子中,没有真正的树结构。解析“Die Sonne Scheint是Himmel。”即使在使用拼凑的依赖关系时,也会得到我作为依赖项的对(“Die”,“Sonne”),(“Sonne”,“scheint”),(“scheint”,“am”)等。

String modelPath = "edu/stanford/nlp/models/parser/nndep/UD_German.gz"; 
    String taggerPath = "edu/stanford/nlp/models/pos-tagger/german/german-hgc.tagger"; 
    String text = "Ich sehe den Mann mit dem Fernglas."; 

    MaxentTagger tagger = new MaxentTagger(taggerPath); 
    DependencyParser parser = DependencyParser.loadFromModelFile(modelPath); 

    DocumentPreprocessor tokenizer = new DocumentPreprocessor(new StringReader(text)); 
    for (List<HasWord> sentence : tokenizer) { 
     List<TaggedWord> tagged = tagger.tagSentence(sentence); 

     GrammaticalStructure gs = parser.predict(tagged); 

     for (TypedDependency td : gs.typedDependenciesCollapsed()) { 
     System.out.println(td.toString()); 
    } 

回答

0

是的,我们在德国的依存分析模型目前破(被列入释放莫名其妙的法国模式,我们目前似乎没有有一个工作的德国模式)。

但是,您可以使用Universal Dependencies project中的数据来训练自己的模型。你可以在project page上找到一些关于如何训练解析器的信息。