我想标记一个句子,但保持预定义的单词不变。例如除了预定义的单词之外,是否可以标记所有单词?
"i went to university of abc and had a wonderful time there!"
成
["i", "went", "to", "university of abc", "and", "had", "a", "wonderful", "time", "there", "!"]
作为"university of abc"
是预先定义的词语。
我无法在任何NLTK标记器中找到此类参数或控件。我可以通过任何方式来实现这一目标?谢谢!
谢谢。我可以将正则表达式的LHS设置为任何预定义的单词吗?即W =“abc大学”,然后在正则表达式中有变量W? – Blue482
您可以使用字符串连接来构建正则表达式。 – anubhava
对不起,延迟回复。明白了,谢谢! :) – Blue482