2017-05-04 87 views
-1

我有两个numpy数组A和B.A包含dtypes = ['ID','Value','Type'],B包含dtypes = ['ID','值']。比较两个numpy数组并替换一个值

本质上,我想用'B'中的值替换A中的'Value',但仅用于两者中的'ID'(因此B中的ID也在A中)。

A = array([[1,2,3,4,5,6,7],[0.785, 0.985, 0.8562, 0.9652, 0.664, 0.962, 0.872],['sio', 'sco', 'sio', 'sco', 'sio', 'sco', 'sio']]) 
B = array([[1,2,3],[0.85,0.4585,0.8436]]) 

A和B的长度是可能在尺寸和因此导致不同的需要来映射值,而不是假定的ID都以相同的顺序。

这样做的最快方法是什么?

+2

请添加一个示例。 – Divakar

回答

1

希望这有助于我用OrderedDict以防万一您的数据不仅是有序的整数:

from collections import OrderedDict 

A = [[1,2,3,4,5,6,7],[0.785,0.985,0.8562,0.9652,0.664,0.962,0.872],[' sio', 'sco', 'sio', 'sco', 'sio', 'sco','sio']] 
B = [[1,2,3],[0.85,0.4585,0.8436]] 

a = OrderedDict(zip(*A[:2])) 
b = dict(zip(*B)) 

c = OrderedDict([(k, b[k] if k in b else v) for k, v in a.items()]) 

A = [c.keys(), c.values(), A[2]] 

输出:

[[1, 2, 3, 4, 5, 6, 7], 
[0.85, 0.4585, 0.8436, 0.9652, 0.664, 0.962, 0.872], 
[' sio', 'sco', 'sio', 'sco', 'sio', 'sco', 'sio']] 
+0

谢谢你的答案是潜在的无序数组所必需的。如果我可以扩展这个问题,如果A中不存在'值'dtype,那么这将如何工作,并且我想基于'ID'将B的列'值'映射到A(如果不存在,则设置为0)不存在)? – naiminp

+0

这取得A的值,如果它们存在于B中,则替换它们在相应索引中的值。我添加了用于添加A中不存在的B值的代码,但是从您的数据中还需要用'sio''和''sco''的第三个数组的信息 – zipa

0

这对你来说足够快吗?

import numpy 

A = numpy.array([[1,2,3,4,5,6,7],[0.785,0.985,0.8562,0.9652,0.664,0.962,0.872],[' sio', 'sco', 'sio', 'sco', 'sio', 'sco','sio']]) 
B = numpy.array([[1,2,3],[0.85,0.4585,0.8436]]) 
for i, x in enumerate(A[0]): 
    if x in str(B[0]): 
     A[1,i] = B[1,i] 
print A 

输出继电器:

[['1' '2' '3' '4' '5' '6' '7'] 
['0.85' '0.4585' '0.8436' '0.9652' '0.664' '0.962' '0.872'] 
[' sio' 'sco' 'sio' 'sco' 'sio' 'sco' 'sio']]