所以我目前正在与布朗语料库合作,而且我遇到了一个小问题。为了应用标记化特征,我首先需要将布朗语料库加入句子。这是我到目前为止有: from nltk.corpus import brown
import nltk
target_text = [s for s in brown.fileids()
if s.startswith('ca01') or s.startswit
dat <- read.csv("file.csv",header=F)$V2
doc.corpus <- Corpus(VectorSource(dat))
....
doc.corpus <- tm_map(doc.corpus, stripWhitespace)
sent <- ""
for(i in 2:length(doc.corpus)){
sent[i] <- g