如何解决比较两个3d Numpy数组,并用索引返回不匹配的值,然后重新创建它们而无需循环
我目前正在解决一个问题,在一个需求中,我需要比较两个3d NumPy数组,并返回不匹配的值及其索引位置,然后重新创建相同的数组。目前,我能想到的唯一方法是在比较和稍后重新创建期间遍历数组以获取值。问题在于规模,因为将有数百个阵列,并且循环影响整个应用程序的延迟。如果有人可以在不使用最小循环或不使用循环的情况下更好地利用NumPy比较,我将不胜感激。伪代码如下:
def compare_array(final_array_list):
base_array = None
i = 0
for array in final_array_list:
if i==0:
base_array =array[0]
else:
index = np.where(base_array != array)
#getting index like (array([0,1]),array([1,array([2,2]))
# to access all unmatched values I need to loop.Need to avoid loop here
i=i+1
return [base_array,[unmatched value (8,10)and its index (array([0,2])],..]
# similarly recreate array1 back
def recreate_array(array_list):
# need to avoid looping while recreating array back
return list of array #i.e. [base_array,array_1]
# creating dummy array
base_array = np.array([[[1,2,3],[3,4,5]],[[5,6,7],[7,8,9]]])
array_1 = b = np.array([[[1,8]],10]]])
final_array_list = [base_array,array_1,...... ]
#compare base_array with other arrays and get unmatched values (like 8,10 in array_1) and their index
difff_array = compare_array(final_array_list)
# recreate array1 from the base array after receiving unmatched value and its index value
recreate_array(difff_array)
解决方法
我认为这可能是您要寻找的东西
base_array = np.array([[[1,2,3],[3,4,5]],[[5,6,7],[7,8,9]]])
array_1 = b = np.array([[[1,8]],10]]])
match_mask = (base_array == array_1)
idx_unmatched = np.argwhere(~match_mask)
# idx_unmatched:
# array([[0,1,2],# [1,2]])
# values with associated with idx_unmatched:
values_unmatched = base_array[tuple(idx_unmatched.T)]
# values_unmatched:
# array([5,9])
,
我不确定我是否理解“重新创建它们”的意思(完全重新创建它们?为什么不自己使用数组?)。
尽管我可以帮助您,但请注意,有很多可以用numpy向量化的函数,并且通常的经验法则是,除非G-d亲自告诉您::
例如:
-
如果
a
,b
是 any 个np.arrays(不考虑尺寸),则简单的a == b
将返回numpy数组具有布尔值的相同大小。正确=在此坐标上相等,否则返回False。 -
函数
np.where(c)
将c
转换为布尔型np.array,并返回c
为True的索引。
要澄清: 在这里,我实例化了两个数组,其中b与带有-1值的a不同: 请注意,最后是a == b。
>>> a = np.random.randint(low=0,high=10,size=(4,4))
>>> b = np.copy(a)
>>> b[2,3] = -1
>>> b[0,1] = -1
>>> b[1,1] = -1
>>> a
array([[9,9,3,4],[8,5,5],[1,7,5]])
>>> b
array([[ 9,-1,[ 8,-1],[ 1,5]])
>>> a == b
array([[ True,False,True,True],[ True,False],True]])
现在,函数np.where
的输出有些棘手,但可以轻松使用。这将返回两个大小相同的数组:第一个数组是行,第二个数组是给定数组为True的位置的列。
>>> np.where(a == b)
(array([0,dtype=int64),array([0,dtype=int64))
现在,您可以通过将b
与a
不同的ar索引的值切换为b
数组以匹配a
来匹配a
。 {1}}的索引:
>>> b[np.where(a != b)]
array([-1,-1])
>>> b[np.where(a != b)] = a[np.where(a != b)]
>>> np.all(a == b)
True
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。