所以,我一直在试图将一个文本文件(每行是一个聊天记录)转换为R,以将它转换为数据帧并进一步整理数据。将文本文件加载到R中以分析聊天记录
我正在使用read.Lines,因此我可以将每个日志作为一行显示。因为read.Lines读取它们一个长字符;然后我将它们转换为字符串(我需要解析日志);按下面
rawchat <- readLines("disc-W-App-avec-loy.txt")
rawchat <- c(lapply(rawchat, toString))
我的问题是当我想要把这个列表到数据帧:
rawchat <- as.data.frame(rawchat)
它把列表转换成1个观察42000个变量的数据帧。目的是将其变成一个变量的42,000个观察值。
请帮忙吗?
顺便说一句,我非常新,在R.
整理原始数据所以,我遇到了另一个块:
我装一个文本文件中的数据帧按如下。
rawchat <- readLines("disc-W-App-avec-loy.txt")
rawchat <- as.data.frame(rawchat, stringsAsFactors=FALSE)
names(rawchat) <- "chat"
我目前正试图确定与16号开始,我似乎无法正确应用startsWith()
功能或dplyr
starts_with()
,甚至grepl
用正则表达式的任何行(42000)。
它可能是数据帧的观察格式(chr
)?
它看起来像'rawchat'是一个矢量,是这样吗?如果是这样,也许'rawchat < - data.frame(text = rawchat,stringsAsFactors = FALSE)'? – rosscova
'data.frame(sapply(rawchat,toString))'是否在你使用'readLines'之后给你正确的答案? – gsun
我没有尝试过。我做了:rawchat < - readLines(“disc -W-App-avec-loy.txt”)“) rawchat < - as.data.frame(rawchat,stringsAsFactors = FALSE) –