Elasticsearch:使用向量搜索来搜索图片及文字

在 eCommerce 里的应用中,我们可以对图像来进行搜索从而达到更好的应用体验。如果你之前阅读过我的文章 “Elasticsearch:如何使用 Elasticsearch 和 Python 构建面部识别系统”,可能对这个并不陌生。我们可以通过对图片的处理,把它变成向量,然后我们再进行向量搜索,从而达到搜索的目的。

在今天的 demo 中,我们来展示如何使用 Elasticsearch 来搜素图片。展示的代码可以在 GitHub - liu-xiao-guo/flask-elastic-nlp 找到。我们可以使用如下的命令来下载代码:

git clone https://github.com/liu-xiao-guo/flask-elastic-nlp

前提条件 

你首先需要安装 Elasticsearch v8.3.0+ 及 Python v3.9+。你需要安装如下的5个 NLP 的模型:

Elasticsearch 资源

要并行运行所有模型,你将需要约 21GB 的内存,因为模型已加载到内存中。

如果你的计算机没有足够的内存,那么你可以配置更少的内存,并且始终只同时运行 1 或 2 个模型,具体取决于您有多少可用内存。 要更改 docker-compose 的值,请转到 es-docker/.env 文件并更改 MEM_LIMIT。这个非常重要。如果你的电脑没有足够的内存,而你配置 21G,极有可能你的 docker 运行不起来。我们需要调整 .env 文件里的内存大小。你如果是在 macOS 上,你可以调整如下的内存配置:

 

安装 Elastic Stack

我们首先来安装 Elasticsearch 及 Kibana。我们进入到 es-docker 目录中:

$ pwd
/Users/liuxg/python/flask-elastic-nlp
$ cd es-docker/
$ ls -al
total 24
drwxr-xr-x   4 liuxg  staff   128 Aug 23 14:42 .
drwxr-xr-x  18 liuxg  staff   576 Aug 23 10:24 ..
-rw-r--r--   1 liuxg  staff   733 Aug 23 15:43 .env
-rw-r--r--   1 liuxg  staff  4599 Aug 23 14:52 docker-compose.yml
$ docker-compose up

在运行上面的命令之前,我们可以查看当前目录下的 .env 文件的配置。针对我的情况,我修改了最新的 Elastic Stack 版本为8.3.3。执行上面的命令后,它会自动下载 Elasticsearch 及 Kibana 的镜像,并启动 docker;

 在这期间,如果你的安装挂掉了,极有可能是你的内存不够而造成的。你需要修改当前目录下的 .env 文章中的这个项:

MEM_LIMIT=21474836480

如果我的安装成功的话,我们可以使用如下的命令来查看:

curl -k -u elastic:changeme https://localhost:9200
$ curl -k -u elastic:changeme https://localhost:9200
{
  "name" : "es01",
  "cluster_name" : "elastic-nlp-8.3.3",
  "cluster_uuid" : "RWAp5DntThedGCsN0Ae3Pw",
  "version" : {
    "number" : "8.3.3",
    "build_flavor" : "default",
    "build_type" : "docker",
    "build_hash" : "801fed82df74dbe537f89b71b098ccaff88d2c56",
    "build_date" : "2022-07-23T19:30:09.227964828Z",
    "build_snapshot" : false,
    "lucene_version" : "9.2.0",
    "minimum_wire_compatibility_version" : "7.17.0",
    "minimum_index_compatibility_version" : "7.0.0"
  },
  "tagline" : "You Know, for Search"
}

如果你看到上面的输出,则标明你的 Elasticsearch 的安装是成功的。我们也可以打开地址 http://localhost:5601 来登录 Kibana:

 我们可以通过如下的命令来查看运行中的 docker 容器:

docker ps
$ docker ps
CONTAINER ID   IMAGE                                                 COMMAND                  CREATED          STATUS                    PORTS                              NAMES
a2393f9bd322   docker.elastic.co/kibana/kibana:8.3.3                 "/bin/tini -- /usr/l…"   13 minutes ago   Up 13 minutes (healthy)   0.0.0.0:5601->5601/tcp             elastic-nlp_kibana_1
4ba6f28c6492   docker.elastic.co/elasticsearch/elasticsearch:8.3.3   "/bin/tini -- /usr/l…"   13 minutes ago   Up 13 minutes (healthy)   0.0.0.0:9200->9200/tcp, 9300/tcp   elastic-nlp_es01_1

从上面的输出中,我们可以看出来有两个容器在运行:一个是 Elasticsearch 而另外一个是 Kibana。

配资 Python env

为了避免我们的 Python 安装和系统的安装混在一起,我们执行如下的命令:

$ cd flask-elastic-nlp
$ python3 -m venv .venv
$ source .venv/bin/activate
$ pip install -r requirements.txt

在安装 requirements.txt 中的 Python 包时,我们可能会遇到有些安装包不存在,这个主要看你是从哪里进行安装的。我对 requirements.txt 做了一点修改。它最终的内容是这样的:

requirements.txt

flask==2.0.2
wtforms==3.0.1
flask-wtf==1.0.1
python-dotenv==0.19.2
Werkzeug~=2.0.3
sentence-transformers~=2.2.0
ftfy~=6.1.1
# image-embeddings
pandas~=1.3.5
elasticsearch~=8.3.3
Pillow~=9.0.1
tqdm~=4.62.3
# eland
eland~=8.2.0
torch~=1.11.0
torchvision~=0.13.1
transformers~=4.19.2

这样我们的 Python 环境就配置好了。

上传 NLP 模型

让我们将模型加载到应用程序中。 我们使用 eland python 客户端来加载模型。 有关更多详细信息,请遵循文档。我们也可以参考文章 “Elasticsearch:使用向量搜索来查询及比较文字 - NLP text embedding” 来上传模型。在上面安装 Python 的过程中,我们已经安装好 eland。我们可以直接使用如下的命令来上传模型:

# wait until each model is loaded and started. If you do not have enough memory, you will see errors sometimes confusing
$ eland_import_hub_model --url https://elastic:changeme@localhost:9200 --hub-model-id dslim/bert-base-NER --task-type ner --start --insecure
$ eland_import_hub_model --url https://elastic:changeme@127.0.0.1:9200 --hub-model-id sentence-transformers/clip-ViT-B-32-multilingual-v1 --task-type text_embedding --start --insecure
$ eland_import_hub_model --url https://elastic:changeme@127.0.0.1:9200 --hub-model-id distilbert-base-uncased-finetuned-sst-2-english --task-type text_classification --start --insecure
$ eland_import_hub_model --url https://elastic:changeme@127.0.0.1:9200 --hub-model-id bert-base-uncased --task-type fill_mask --start --insecure
$ eland_import_hub_model --url https://elastic:changeme@127.0.0.1:9200 --hub-model-id sentence-transformers/msmarco-MiniLM-L-12-v3 --task-type text_embedding --start --insecure
$ eland_import_hub_model --url https://elastic:changeme@127.0.0.1:9200 --hub-model-id deepset/tinyroberta-squad2 --task-type question_answering --start --insecure

我们在项目的根目录中分别打入上面的命令:

我们回到 Kibana 的界面:

 

 

我们按照同样的方法把剩下的4个模型都上传到 Elasticsearch 中:

这样我们最终看到所有的模型都被上传了:

如果你在屏幕中看到缺少某些模型并看到一条消息。 需要 ML 作业和经过训练的模型同步,继续并单击链接以同步模型。 

 

 

导入数据索引

我们还需要在烧瓶应用程序中使用的数据索引。 在此过程中,脚本还将从 Unsplash 下载数据集。

确保设置了 Python 环境。

$ cd embeddings
$ python3 build-datasets.py --es_host "https://127.0.0.1:9200" --es_user "elastic" --es_password "changeme" --no-verify_certs --delete_existing

等运行完上面的命令后,我们会发现:

 

这里的 blogs 也就是我们在另外一篇文章 “Elasticsearch:使用向量搜索来查询及比较文字 - NLP text embedding” 中使用到的索引。 我们可以通过如下的命令来查看新生成的索引:

GET _cat/indices

上面的命令返回:

yellow open image-embeddings       sO3-86hmQ_e9fg1uaYw9Xw 1 1 19833 0 197.4mb 197.4mb
yellow open blogs                  JiZuoqCFQkapgMgpeM0D-Q 1 1   326 0   3.8mb   3.8mb
yellow open les-miserable-embedded ZExnlOVnShC5P_2wdIdvhw 1 1 14021 0   107mb   107mb

从上面的输出中,我们可以看到有三个索引被生成。我们可以通过如下的命令来查看每个索引的 mapping:

GET image-embeddings/_mapping
{
  "image-embeddings": {
    "mappings": {
      "properties": {
        "ai_description": {
          "type": "text"
        },
        "exif_camera_make": {
          "type": "keyword"
        },
        "exif_camera_model": {
          "type": "keyword"
        },
        "exif_iso": {
          "type": "integer"
        },
        "image_embedding": {
          "type": "dense_vector",
          "dims": 512,
          "index": true,
          "similarity": "cosine"
        },
        "photo_description": {
          "type": "text"
        },
        "photo_id": {
          "type": "keyword"
        },
        "photo_image_url": {
          "type": "keyword"
        },
        "photo_url": {
          "type": "keyword"
        },
        "photographer_first_name": {
          "type": "keyword"
        },
        "photographer_last_name": {
          "type": "keyword"
        },
        "photographer_username": {
          "type": "keyword"
        }
      }
    }
  }
}

从上面,我们可以看出来 image_embedding 字段是一个 512 维度的 dense_vector 字段。它可以进行向量搜索。

 

运行 Flash App

确保设置了 Python 环境。

# In the main directory 
# !!! configure file `.env` with values pointing to your Elasticsearch cluster
$ flask run --port=5001
# Access URL `127.0.0.1:5001`

我们在电脑的浏览器中打开 http://localhost:5001:

 

当我们输入 “A mountain covered in snow” 时,我们可以看到上面显示的画面。我们也可以使用上面的另外一个例子 “Valentine day flowers”,我们可以看到如下的搜索结果:

 我打入了一个中文的句子 “我喜欢北京”:

我们也可以搜索一个相同的图片,比如我们搜索如下的图片​​​​​​​:

 

我们进行搜索:

 从上面,我们可以看到被搜索出来的图片。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


学习编程是顺着互联网的发展潮流,是一件好事。新手如何学习编程?其实不难,不过在学习编程之前你得先了解你的目的是什么?这个很重要,因为目的决定你的发展方向、决定你的发展速度。
IT行业是什么工作做什么?IT行业的工作有:产品策划类、页面设计类、前端与移动、开发与测试、营销推广类、数据运营类、运营维护类、游戏相关类等,根据不同的分类下面有细分了不同的岗位。
女生学Java好就业吗?女生适合学Java编程吗?目前有不少女生学习Java开发,但要结合自身的情况,先了解自己适不适合去学习Java,不要盲目的选择不适合自己的Java培训班进行学习。只要肯下功夫钻研,多看、多想、多练
Can’t connect to local MySQL server through socket \'/var/lib/mysql/mysql.sock问题 1.进入mysql路径
oracle基本命令 一、登录操作 1.管理员登录 # 管理员登录 sqlplus / as sysdba 2.普通用户登录
一、背景 因为项目中需要通北京网络,所以需要连vpn,但是服务器有时候会断掉,所以写个shell脚本每五分钟去判断是否连接,于是就有下面的shell脚本。
BETWEEN 操作符选取介于两个值之间的数据范围内的值。这些值可以是数值、文本或者日期。
假如你已经使用过苹果开发者中心上架app,你肯定知道在苹果开发者中心的web界面,无法直接提交ipa文件,而是需要使用第三方工具,将ipa文件上传到构建版本,开...
下面的 SQL 语句指定了两个别名,一个是 name 列的别名,一个是 country 列的别名。**提示:**如果列名称包含空格,要求使用双引号或方括号:
在使用H5混合开发的app打包后,需要将ipa文件上传到appstore进行发布,就需要去苹果开发者中心进行发布。​
+----+--------------+---------------------------+-------+---------+
数组的声明并不是声明一个个单独的变量,比如 number0、number1、...、number99,而是声明一个数组变量,比如 numbers,然后使用 nu...
第一步:到appuploader官网下载辅助工具和iCloud驱动,使用前面创建的AppID登录。
如需删除表中的列,请使用下面的语法(请注意,某些数据库系统不允许这种在数据库表中删除列的方式):
前不久在制作win11pe,制作了一版,1.26GB,太大了,不满意,想再裁剪下,发现这次dism mount正常,commit或discard巨慢,以前都很快...
赛门铁克各个版本概览:https://knowledge.broadcom.com/external/article?legacyId=tech163829
实测Python 3.6.6用pip 21.3.1,再高就报错了,Python 3.10.7用pip 22.3.1是可以的
Broadcom Corporation (博通公司,股票代号AVGO)是全球领先的有线和无线通信半导体公司。其产品实现向家庭、 办公室和移动环境以及在这些环境...
发现个问题,server2016上安装了c4d这些版本,低版本的正常显示窗格,但红色圈出的高版本c4d打开后不显示窗格,
TAT:https://cloud.tencent.com/document/product/1340