2017-02-10 17 views
1

所以,我一直在试图将一个文本文件(每行是一个聊天记录)转换为R,以将它转换为数据帧并进一步整理数据。将文本文件加载到R中以分析聊天记录

我正在使用read.Lines,因此我可以将每个日志作为一行显示。因为read.Lines读取它们一个长字符;然后我将它们转换为字符串(我需要解析日志);按下面

rawchat <- readLines("disc-W-App-avec-loy.txt") 
rawchat <- c(lapply(rawchat, toString)) 

我的问题是当我想要把这个列表到数据帧:

rawchat <- as.data.frame(rawchat) 

它把列表转换成1个观察42000个变量的数据帧。目的是将其变成一个变量的42,000个观察值。

请帮忙吗?

顺便说一句,我非常新,在R.


整理原始数据所以,我遇到了另一个块:

我装一个文本文件中的数据帧按如下。

rawchat <- readLines("disc-W-App-avec-loy.txt") 
rawchat <- as.data.frame(rawchat, stringsAsFactors=FALSE) 
names(rawchat) <- "chat" 

我目前正试图确定与16号开始,我似乎无法正确应用startsWith()功能或dplyrstarts_with(),甚至grepl用正则表达式的任何行(42000)。

它可能是数据帧的观察格式(chr)?

+0

它看起来像'rawchat'是一个矢量,是这样吗?如果是这样,也许'rawchat < - data.frame(text = rawchat,stringsAsFactors = FALSE)'? – rosscova

+0

'data.frame(sapply(rawchat,toString))'是否在你使用'readLines'之后给你正确的答案? – gsun

+0

我没有尝试过。我做了:rawchat < - readLines(“disc -W-App-avec-loy.txt”)“) rawchat < - as.data.frame(rawchat,stringsAsFactors = FALSE) –

回答

1

的问题是你的rawchat <- c(lapply(rawchat, toString)) 只需使用

rawchat <- readLines("disc-W-App-avec-loy.txt")") 
rawchat <- as.data.frame(rawchat, stringsAsFactors=FALSE) 
+0

嗯,我感到有点惭愧。很简单,非常感谢! –