如何解决从10M样本中查找最接近向量的有效方法
说我有一个数据库,其中包含100万个矢量的10000万:
X1 = [x1_1,...,x1_100]
X2 = [x2_1,x2_100]
...
X1000000 = [x1000000_1,x1000000_100]
我有输入向量Y:
Y = [y1,y100]
从欧几里得距离的意义上找到最接近向量Xi的最有效方法是什么?
解决方法
尝试
def find_CD(X,y):
return return spatial.distance.euclidean(X,y)
主要
listt=[]
vic=[x1,x2,.....,X1000000]
for i in range(len(vic)):
listt.append(find_CD(vic[i],y)
并找到最小值索引
listt.index(min(listt))
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。