2013-04-04 103 views
25

我想将一列添加到从recfromcsv创建的数组中。在这种情况下,它是一个数组:[210,8](行,列)。如何将列添加到numpy数组

我想添加第九列。空或零与无关紧要。

from numpy import genfromtxt 
from numpy import recfromcsv 
import numpy as np 
import time 

if __name__ == '__main__': 
print("testing") 
my_data = recfromcsv('LIAB.ST.csv', delimiter='\t') 
array_size = my_data.size 
#my_data = np.append(my_data[:array_size],my_data[9:],0) 

new_col = np.sum(x,1).reshape((x.shape[0],1)) 
np.append(x,new_col,1) 
+1

什么不工作呢? – 2013-04-04 15:52:18

+0

不工作的事情是,无论我尝试什么版本,它都不会给我正确的尺寸。 – user2130951 2013-04-04 18:13:36

回答

49

我认为你的问题是你期望np.append就地添加列,但是它做了什么,因为存储的数据是如何变化的,就是创建一个连接数组的副本

Returns 
------- 
append : ndarray 
    A copy of `arr` with `values` appended to `axis`. Note that `append` 
    does not occur in-place: a new array is allocated and filled. If 
    `axis` is None, `out` is a flattened array. 

所以你需要保存输出all_data = np.append(...)

my_data = np.random.random((210,8)) #recfromcsv('LIAB.ST.csv', delimiter='\t') 
new_col = my_data.sum(1)[...,None] # None keeps (n, 1) shape 
new_col.shape 
#(210,1) 
all_data = np.append(my_data, new_col, 1) 
all_data.shape 
#(210,9) 

替代方式:

all_data = np.hstack((my_data, new_col)) 
#or 
all_data = np.concatenate((my_data, new_col), 1) 

我相信,(np.vstack以及)这三种功能之间的唯一区别是他们在axis未指定时的默认行为:

  • concatenate假定axis = 0
  • hstack假定axis = 1除非输入是一维,然后axis = 0
  • vstack添加轴之后假定axis = 0如果输入是一维
  • append变平阵列

基于你的评论,并更仔细地查看你的示例代码,我现在相信你是一个可能想要做的是添加一个字段record array。您同时导入了genfromtxt,它返回structured arrayrecfromcsv,它返回微妙不同的record array (recarray)。你现在使用的recfromcsv所以现在my_data实际上是recarray,这意味着最有可能的my_data.shape = (210,)因为recarrays是1d的记录数组,其中每个记录都是具有给定dtype的元组。

所以,你可以试试这个:

import numpy as np 
from numpy.lib.recfunctions import append_fields 
x = np.random.random(10) 
y = np.random.random(10) 
z = np.random.random(10) 
data = np.array(list(zip(x,y,z)), dtype=[('x',float),('y',float),('z',float)]) 
data = np.recarray(data.shape, data.dtype, buf=data) 
data.shape 
#(10,) 
tot = data['x'] + data['y'] + data['z'] # sum(axis=1) won't work on recarray 
tot.shape 
#(10,) 
all_data = append_fields(data, 'total', tot, usemask=False) 
all_data 
#array([(0.4374783740738456 , 0.04307289878861764, 0.021176067323686598, 0.5017273401861498), 
#  (0.07622262416466963, 0.3962146058689695 , 0.27912715826653534 , 0.7515643883001745), 
#  (0.30878532523061153, 0.8553768789387086 , 0.9577415585116588 , 2.121903762680979), 
#  (0.5288343561208022 , 0.17048864443625933, 0.07915689716226904 , 0.7784798977193306), 
#  (0.8804269791375121 , 0.45517504750917714, 0.1601389248542675 , 1.4957409515009568), 
#  (0.9556552723429782 , 0.8884504475901043 , 0.6412854758843308 , 2.4853911958174133), 
#  (0.0227638618687922 , 0.9295332854783015 , 0.3234597575660103 , 1.275756904913104), 
#  (0.684075052174589 , 0.6654774682866273 , 0.5246593820025259 , 1.8742119024637423), 
#  (0.9841793718333871 , 0.5813955915551511 , 0.39577520705133684 , 1.961350170439875), 
#  (0.9889343795296571 , 0.22830104497714432, 0.20011292764078448 , 1.4173483521475858)], 
#  dtype=[('x', '<f8'), ('y', '<f8'), ('z', '<f8'), ('total', '<f8')]) 
all_data.shape 
#(10,) 
all_data.dtype.names 
#('x', 'y', 'z', 'total') 
+0

在_sum中获得文件“d:\ python27 \ lib \ site-packages \ numpy \ core \ _methods.py”,第18行out = out,keepdims = keepdims) TypeError:无法使用弹性类型执行缩减 – user2130951 2013-04-04 17:23:46

+0

@ user2130951数组的'dtype'是什么? 'my_data.dtype' – askewchan 2013-04-04 18:28:20

+0

@ user2130951您确定不想添加_field_吗? – askewchan 2013-04-04 18:46:22

5

如果你有一个数组中,a 8列说210行:

a = numpy.empty([210,8]) 

,并要添加的零的第九列,你可以这样做:

b = numpy.append(a,numpy.zeros([len(a),1]),1) 
+2

这会生成返回级联((arr,values),axis = axis) ValueError:所有输入数组必须具有相同的维数 – user2130951 2013-04-04 17:25:43

+0

hmmmm。双重检查。它适用于我(使用IDLE - python版本2.7) – atomh33ls 2013-04-05 12:30:36

+0

也许这是因为,正如@askewchan所建议的,您实际上有一个recarry?我认为这将工作,如果你使用'numpy.genfromtxt'或'numpy.loadtxt'导入? – atomh33ls 2013-04-05 14:32:16

1

我与那些添加一个新列矩阵阵列以这样的方式

Z = append([[1 for _ in range(0,len(Z))]], Z.T,0).T 

也许这是不是有效?

+1

不要使用列表理解,请使用['np.ones'](http://docs.scipy.org/doc/numpy/reference/generated/numpy.ones.html)或['np.ones_like'] (http://docs.scipy.org/doc/numpy/reference/generated/numpy.ones_like.html):'append([np.ones_like(Z)],ZT,0).T' – askewchan 2013-09-13 14:49:12