2015-06-09 126 views
0

当使用stemDocument函数从TM(文本挖掘)R包“已经”被转换的字为“alreadi”意外结果

例如:

我正在分析一个语料库文档中的一些推文。

其中鸣叫的显示执行该命令之前执行以下操作:

myCorpus <- tm_map(myCorpus, stemDocument, language = "english")> 
inspect(myCorpus[98]) 

我得到以下结果::

[[1]] 
PlainTextDocument (metadata: 7) 
select member jeffroki attend sqlsat true alreadi eventdt httptcoquyndcg sqlpass 

inspect(myCorpus[98]) 
<<VCorpus (documents: 1, metadata (corpus/indexed): 0/0)>> 

[[1]] 
<<PlainTextDocument (metadata: 7)>> 
select member jeffroky attending sqlsat true already eventdt httptcoquyndcgs sqlpass 

执行下面的代码行后

请注意单词“已经”更改为“alreadi” 可以someo恩对这种行为有所了解?

谢谢! Luis

回答