我想读一个单一的文件作为语料库一个单一的文件,但没有发现任何SLOUTION,我试图与 >fdat <- readLines(fname)
> reuters=suppressWarnings(Corpus(VectorSource(fdat),readerControl = list(language = "en")))
> reuters
A corpus with 139 text d
我有一个1500万字的语料库,我希望将其存储在数据库中。然后,我希望能够找到给定的单词,它在语料库中的上下文。例如,对于单词“朋友”我可能会选择以下内容,其中我也选择五个字前后各有“朋友”: ... night i went to my FRIENDS house for a cup of tea ...
... what did you say my FRIENDS cat is sick a
我想用WordNet注释使用GATE注释文本语料库。在将WordNet克里奥尔插件添加到GATE-Developer系统后,我只能将WordNet作为语言资源添加,但不能作为处理资源或应用程序。所以我不能将它添加到语料库管道中。 我会很感激这里的任何帮助。 (是的,我看过的GATE user manual。)