转化CSV数据说我有以下数据格式的csv文件:进行分析和可视化
ID, Name, Gender, Q1
1, ABC, Male, "A1;A2"
2, ACB, Male, "A2;A3;A4"
3, BAC, Female, "A1"
我想将其改造成以下格式,使我的数据虚拟化工具能够正确地处理它:
ID, Name, Gender, Questions, Responses
1, ABC, Male, Q1, A1
1, ABC, Male, Q1, A2
2, ACB, Male, Q1, A2
2, ACB, Male, Q1, A3
2, ACB, Male, Q1, A4
3, BAC, Female, Q1, A1
在LibreOffice中使用Text to Columns
特征我可以很容易分开Q1柱A1;A2
到像A1, A2
不同的列,但我停留在转置和重复的行。
附加信息:
数据通过谷歌的形式被收集,不幸的是Google电子表格存储用分号分隔状
A1;A2;A3...
在一个单元选择题问题的答复,而我的可视化工具无法看到此基础数据结构,只把它们当作一个单一的字符串,使得聚合/分组困难。在实际数据(调查结果)我有围绕5000个条目,每个与需要这样的处理的多个小区,其将导致大约100,000的条目的表。需要一种自动化转换的方法。
我用它来分析/可视化数据为“的Tableau公共”的工具,他们对Excel中的数据整形插件,半自动化such tasks(见确保每行只包含一个数据的),但没有LibreOffice替代方案。
我也有同样的需求,也适用于Tableau。我真的很惊讶,也有不适合来回转换这两种格式之间的标准工具:交叉/宽<->标准化/长 – 2014-11-16 22:47:18