2017-02-09 181 views
0

我收到一小段代码,它只能在熊猫数据框中作为输入使用。我目前有一个非常大的numpy数组。我需要将其转换为熊猫数据框。Python将大型numpy数组转换为熊猫数据框

Dataframe将288行(289个列名)和1801列。我有一个大小为1801的数组,它将成为数据框中的所有列名称。然后我有一个大小的数组(288),它将填充第一列。然后我有一组形状(1800,288),将填充2-1801列。有没有一种简单的方法可以把它变成一个数据框,而不需要单独定义所有的1801列?

我知道我可以定义像column2 = array [0 ,:],column3 = array [1 ,:]这样的列,但是对于1801列来说这将是很多工作。

回答

4

您可以直接传递一个numpy的阵列到数据帧的构造函数:

In [11]: a = np.random.rand(3, 5) 

In [12]: a 
Out[12]: 
array([[ 0.46154984, 0.08813473, 0.57746049, 0.42924157, 0.34689139], 
     [ 0.29731858, 0.83300176, 0.15884604, 0.44753895, 0.56840054], 
     [ 0.02479636, 0.76544594, 0.24388046, 0.06679485, 0.94890838]]) 

In [13]: pd.DataFrame(a) 
Out[13]: 
      0   1   2   3   4 
0 0.461550 0.088135 0.577460 0.429242 0.346891 
1 0.297319 0.833002 0.158846 0.447539 0.568401 
2 0.024796 0.765446 0.243880 0.066795 0.948908 

In [14]: pd.DataFrame(a.T) 
Out[14]: 
      0   1   2 
0 0.461550 0.297319 0.024796 
1 0.088135 0.833002 0.765446 
2 0.577460 0.158846 0.243880 
3 0.429242 0.447539 0.066795 
4 0.346891 0.568401 0.948908 
相关问题