0
我正在进行句子分析,在此处理解句子并将信息解密为键值对。 像如按含义规范化单词
{ "product" : "milk" , "money": "200 usd" }
{ "product" : "chair" , "cost": "200 usd" }
{ "product" : "chair" , "price": "200 usd" }
现在这个JSON放出来不容易使用,除非我正常化了。 我想正常化所有意味着金钱的词语,就像金钱一样。
{ "product" : "milk" , "money": "200 usd" }
{ "product" : "chair" , "money": "200 usd" }
{ "product" : "chair" , "money": "200 usd" }
所以现在都意味着
资金,成本,价格都实际上意味着金钱。
有没有办法像这样规范化? 我在nltk搜索的是stemmer和lemmatizer。但它似乎并没有达到我的意思。有人可以指导吗?
好的建议。 OP可能在特定的域中工作,所以他们可能已经有了一个“规范条目”列表来定位。 – alexis