我有一种形式的数据,类别和值位于由“;”分隔的同一行中。如下所示:如何使用动态列数重新格式化数据
{{category1;value}, {category2;value}, {category3;value} ....}}
在每一行的数据是这样的,可能有不同数量的类别。所以,第一行可能有category1到category5,而第二行可能有category1到category10。类别总是按顺序排列。
我需要解析数据并创建一个新文件,以便我有列标题中的类别名称和相应行中的值。
category1 category2 category3 category4 ....
value value value value
但是由于我不能说可能有多少类别,所以我需要添加每个新列。所以,解析第一行我会知道有5列(cat1到cat5),但对于第二行,我必须将cat6的列添加到cat10等等。
任何想法如何做到这一点。任何Linux bash脚本都可以,但python比我更可取。
类别或值可以包含括号? – unutbu
@unutbu值可以有任何字符。但类别周围有大括号;值对也如图所示。 – sfactor
如果'value'可以包含任何字符,那么应该使用什么规则来确定“{{category1; value},{category2; value}}”没有被分析为具有一个类别“category1”,值为value },{category2; value'? – unutbu