2
我有,其行是格式如下一个JSON文件:JSON格式CSV格式转换,特殊情况
{"checkin_info": {"11-3": 17, "8-5": 1, "15-0": 2, "15-3": 2, "15-5": 2, "14-4": 1, "14- 5": 3, "14-6": 6, "14-0": 2, "14-1": 2, "14-3": 2, "0-5": 1, "1-6": 1, "11-5": 3, "11-4": 11, "13-1": 1, "11-6": 6, "11-1": 18, "13-6": 5, "13-5": 4, "11-2": 9, "12-6": 5, "12-4": 8, "12-5": 5, "12-2": 12, "12-3": 19, "12-0": 20, "12-1": 14, "13-3": 1, "9-5": 2, "9-4": 1, "13-2": 6, "20-1": 1, "9-6": 4, "16-3": 1, "16-1": 1, "16-5": 1, "10-0": 3, "10-1": 4, "10-2": 4, "10-3": 4, "10-4": 1, "10-5": 2, "10-6": 2, "11-0": 3}, "type": "checkin", "business_id": "KO9CpaSPOoqm0iCWm5scmg"}
等等....它有8282项是这样。
我想将它转换成像这样的csv文件。
business_id "0-0" "1-0" "2-0" "3-0" ….. "23-0" "0-1" ……. "23-1" …….. "0-4" …… "23-4" …… "23-6"
1 KO9CpaSPOoqm0iCWm5scmg 2 1 0 1 NA 1 1 NA NA NA NA NA 6 NA 7
2 oRqBAYtcBYZHXA7G8FlPaA 1 2 2 NA NA 2 NA NA 1 NA 2 NA 2 NA 2
我尝试这样做的代码:
urlc <- "C:\\Users\\Ayush\\Desktop\\yelp_training_set\\yelp_training_set_checkin.json"
conc = file(urlc, "r")
inputc <- readLines(conc, -1L)
usec <- lapply(X=inputc,fromJSON)
for (i in 1:8282)
{
tt<-usec[[i]]$checkin_info
bb<-toString(tt)
usec[[i]]$checkin_info<-bb
}
dfc <- data.frame(matrix(unlist(usec), nrow=length(usec), byrow=T))
write.csv(dfc,file="checkin_tr.csv")
将其转化成形式是这样的:上述
X1
business_id
1, 1, 1, 1, 1, 1, 2, 1, 2, 1, 1, 2, 1, 1, 1, 2, 1
D0IB17N66FiyYDCzTlAI4A
1, 1, 2, 1, 1
HLQGo3EaYVvAv22bONGkIw
1, 1, 1, 1
J6OojF0R_1OuwNlrZI-ynQ 2, 1, 2, 1, 2, 1, 1, 1, 1, 4, 1, 1, 1, 1, 1, 1, 2, 1, 2
但我想在列 “X1” 的条目在单独的列,如图所示在第一个表格中。
我该怎么做?请帮助
将尝试,并会让你知道它是否工作。非常感谢。 –
这里'tt'只代表我的json文件的一行。我的文件有8282行。 所以你可以修改你的代码,并使用'url'来写它,就像我已经完成了一样。否则我会感到困惑。无法只访问一行。我试过这个。 urlc < - “C:\\用户\\ AYUSH \\桌面\\ yelp_training_set \\ yelp_training_set_checkin.json” 浓度=文件(urlc, “R”) inputc < - readlines方法(浓,-1L) TT < - lapply(X = inputc,fromJSON) data.frame(business_id = TT $ business_id, do.call(rbind,列表(TT $ checkin_info))) 但是该数据帧是NULL。 –
@ user2474387我使用新的解决方案编辑我的答案。 – agstudy