1
我希望将Endnote的xml输出转换为R数据框,每个子节点都有一个单独的列。将endnote XML转换为R数据框
一个类似的问题先前被要求here,但答案并没有解决多个作者,关键字等记录问题(尽管问题已被记录)。
我想知道如何为诸如贡献者,期刊,关键字等字段添加分隔符(例如;),这些字段通常会返回多个值。
示例数据如下。可以看出,上述字段的条目有多个条目没有添加分隔符。
library(XML)
library(RCurl)
urldata<-"https://gist.githubusercontent.com/nickbond/4f5a600836bf43a60d99e2a63e5a62de/raw/2088f8065eebbfe9e57c761ffa801b0a18588498/endnote.xml"
endnotexml<-xmlParse(getURL(urldata))
xmlToDataFrame(getNodeSet(endnotexml,'//*/record'))
我尝试了一系列方法 - 包括尝试首先转换为列表,并通过for-loop迭代条目。后者对于我的案件数量来说太慢了。任何援助非常感谢。
非常感谢克里斯。这与所描述的一样工作,并且根据需要添加额外的节点/列是一个简单的过程。非常感谢!! – nickb