我最近开始研究德语文本中的情感分析项目,并计划使用词法分析器来改进结果。德语中的Python情感分析NLTK
NLTK附带德国雪球干燥器,我已经试过使用它,但我不确定结果。也许它应该是这样,但作为一个计算机科学家而不是语言学家,我有一个问题与屈曲动词形式源于不同的词干。
取“suchen”(搜索)这个词,它被认为是第一人称单数的“such”,而第三人称单数是“sucht”。
我知道也有词形化,但据我所知,没有工作的德语lemmatizer被整合到NLTK中。有GermaNet,但他们的NLTK集成似乎已被中止。
到达这一点:我希望折中的动词形式被归为同一词干,至少对于同一时期内的常规动词。如果这不是我的目标有用的要求,请告诉我为什么。如果是这样,你知道有哪些额外的资源可以帮助我实现这个目标吗?
编辑:我忘了提及,任何软件都应该可以免费用于教育和研究目的。
谢谢,我一定会试一试,当我回到它。 – Florian