编辑:如何格式化(a)CSV文件中的数据以便可以轻松导入到R中?
所以,这种格式将工作:
featureID charge xcoordinate ycoordinate
1 2 5105.9217 336.125209180674
1 2 5108.7642 336.124751115092
2 0 2434.9217 145.893331325278
但是如果我有连结多个值两列。说柱质量有机器和链接的质量和列看起来像这样
MachineQuality
[[{1:1224}, {2:3453}], [{1:2242}, {2:4142}]
现在,如果我想拆分像我与凸形轮廓的坐标做我需要2行,而不是1,但不会,我需要2行,每行已在(SO 4,因为已经有2个额外的坐标)是这样的:
featureID charge xcoordinate ycoordinate quality1 quality2
1 2 5105.9217 336.125209180674 1224 3453
1 2 5105.9217 336.125209180674 2242 4142
1 2 5108.7642 336.124751115092 1224 3453
1 2 5108.7642 336.124751115092 2242 4142
[...]
它会是这样?
我对R很陌生,我的知识并没有比知道如何制作矢量和一些简单的情节更进一步。我将在接下来的几个月里使用R进行一个实习项目,在此期间,我将(希望)学习一些R的内容。然而,在我开始之前,我需要产生我的数据去做统计。我需要事先知道如何格式化我的输出CSV数据,以便在开始进行R分析时可以轻松读取它。
我被要求做的一件事是从数据中提取一个CSV文件,以便它可以被R读入。用R导入的CSV文件示例我见过都是这样的
featureID Charge value
1 2 10
2 0 9
但是,我的数据主要是由其值包含多个值的列组成。澄清: 作为一个例子,我的数据存在“功能”,其中的其他信息具有“凸起”。这个凸包由成对的x和y坐标组成。因此,我可能会对数据(只显示两个坐标,可以是很多)
featureID Charge Convexhull
1 2 [[{'y': '336.125209180674'}, {'x': '5105.9217'}], [{'y': '336.124751115092'}, {'x': '5108.7642'}]]
是否有可能在一个CSV文件中得到这个,能够R中正确读取(以便配对的X并保存y坐标)?如果是这样,那么CSV文件应该如何?例如,我已经看到了这个样子与多个值CSV文件的示例:
featureID charge xcoordinate ycoordinate
1 2 5105.9217 336.125209180674
5108.7642 336.124751115092
2 0 2434.9217 145.893331325278
但我找不到,如果这很容易被R.
进口如果这不是可行一个CSV文件,是CSV文件轻松导入的独立主键思想,如数据库链接?
只是不要在第二行留下'featureID'和'charge'空白;重复值1和2. – joran 2012-02-20 17:07:39
但现在我只包含一列有多个值,如果我有更多,我应该为每个可能的组合做一个不同的行? – 2012-02-20 17:39:51
我不明白你的评论。也许如果你用一个更充分说明你的观点的例子来编辑你的问题......? – joran 2012-02-20 18:08:55