文本分析我想用TM包希伯来文或阿拉伯文文本分析。我试了好几种方法,看看是否TM将能够处理一些话,但我遇到了一个错误,是否有解决这个问题的方法吗?如何使用TM封装在希伯来文或阿拉伯文
text <- "הנוסעים חיכו זמן רב לנסיעה"
Encoding(text)
#[1] "unknown"
Encoding(text) <- "UTF-8"
ap.corpus <- Corpus(DataframeSource(data.frame(text)))
ap.corpus <- tm_map(ap.corpus, removePunctuation)
ap.corpus <- tm_map(ap.corpus, content_transformer(tolower))
Error in FUN(content(x), ...) :
invalid input 'הנוסעים חיכו זמן רב לנסיעה' in 'utf8towcs'
嗨@Hoju,我得到了: 错误DataframeSource(data.frame(文本),readerControl =名单(语言= “希伯来书”)): 未使用的参数(readerControl =名单(语言= “希伯来书”)) – mql4beginner