2016-06-24 17 views
0

目前我储存我的数据以下列方式在一个CSV文件:适当的格式化数据的CSV,方便导入与熊猫

a,b,c 
1 1 1 1,22 22 22,333 333 333 
10 10 10, 20 20 20, 30 30 30 

然而,这原来是熊猫或R中的一个重大的痛苦数据框,因为默认情况下,每种语言都将这些值视为字符串。因此,我必须手动修正每个字符串为一个数组(在空格上拆分,将字符串转换为浮点数/整数等)。有没有更有效的方式来存储数据,所以我可以立即读取数据作为浮动数组?

+0

做你的名单有不同或相同的长度? – MaxU

+0

是的,它们长度相同。 – user985030

+0

在这种情况下,我会尝试将DF转换为面板(3D对象),然后将它们存储为PyTables(HDF5存储)。您可以将您的列视为__Data Frames__,数据平坦(无列表) – MaxU

回答

0

你可以试试这个:

df[columns] = df[columns].convert_objects(convert_numeric=True) 
# astype 
df[columns] = df[columns].astype('float32')