在我看来,Parsey在正确标记问题和任何带有“is”的句子中存在严重问题。Parsey McParseface在问题上错误地识别根
文字:奥巴马来自夏威夷吗?
GCloud令牌(正确):
- 为 - [根] VERB
- 营房 - [NN] NOUN
- 奥巴马 - [nsubj] NOUN
- 从 - [ADP] PREP
- 夏威夷 - [pobj] NOUN
Parsey令牌(错误):
- 为 - [警察] VERB
- 营房 - [nsubj] NOUN
- 奥巴马 - [根] NOUN
- 从 - [ADP] PREP
- 夏威夷 - [pobj]名词
Parsey决定让名词(!)奥巴马成为根,这会弄乱一切。
文本:我的名字是菲利普
GCloud令牌(正确):
- 我的[POSS] PRON
- 名称[nsubj] NOUN
- 是[根] VERB
- Philipp [attr] NOUN 个
ParseyTokens(不正确的):
- 我的[POSS] PRON
- 名称[nsubj] NOUN
- 是[COP] VERB
- 菲利普[根] NOUN
parsey再次选择NOUN作为根,并与COP一起奋斗。
任何想法,为什么发生这种情况,我该如何解决它?
感谢, 菲尔
从来没有使用过Tensorflow,但标题本身值得upvote ^^ –