MongoDB入门之索引

《MongoDB入门之索引》要点:
本文介绍了MongoDB入门之索引,希望对您有用。如果有疑问,可以联系我们。

索引就像书的目录,如果查找某内容在没有目录的帮助下,只能全篇查找翻阅,这导致效率非常的低下;如果在借助目录情况下,就能很快的定位具体内容所在区域,效率会直线提高.

索引简介

首先打开命令行,输入mongo.默认mongodb会连接名为test的数据库.

➜  ~  mongoMongoDB shell version: 2.4.9connecting to: test> show collections> 

可以使用show collections/tables查看数据库为空.

然后在mongodb命令行终端执行如下代码

> for(var i=0;i<100000;i++) {... db.users.insert({username:'user'+i})... }> show collectionssystem.indexesusers> 

再查看数据库发现多了system.indexesusers两个表,前者即所谓的索引,后者为新建的数据库表.

这样user表中即有了10万条数据.

> db.users.find{ "_id" : ObjectId("5694d5da8fad9e319c5b43e4"),"username" : "user0" }{ "_id" : ObjectId("5694d5da8fad9e319c5b43e5"),"username" : "user1" }{ "_id" : ObjectId("5694d5da8fad9e319c5b43e6"),"username" : "user2" }{ "_id" : ObjectId("5694d5da8fad9e319c5b43e7"),"username" : "user3" }{ "_id" : ObjectId("5694d5da8fad9e319c5b43e8"),"username" : "user4" }{ "_id" : ObjectId("5694d5da8fad9e319c5b43e9"),"username" : "user5" }

现在需要查找其中任意一条数据,比如

> db.users.find({username: 'user1234'}){ "_id" : ObjectId("5694d5db8fad9e319c5b48b6"),"username" : "user1234" }

发现这条数据成功找到,但需要了解详细信息,需要加上explain方法

> db.users.find({username: 'user1234'}).explain{    "cursor" : "BasicCursor","isMultiKey" : false,"n" : 1,"nscannedObjects" : 100000,"nscanned" : 100000,"nscannedObjectsAllPlans" : 100000,"nscannedAllPlans" : 100000,"scanAndOrder" : false,"indexOnly" : false,"nYields" : 0,"nChunkSkips" : 0,"millis" : 30,"indexBounds" : {            },"server" : "root:27017"}

参数很多,目前我们只关注其中的"nscanned" : 100000"millis" : 30这两项.

nscanned表示mongodb在完成这个查询过程中扫描的文档总数.可以发现,集合中的每个文档都被扫描了,并且总时间为30毫秒.

如果数据有1000万个,如果每次查询文档都遍历一遍.呃,时间也是相当可观.

对于此类查询,索引是一个非常好的解决方案.

> db.users.ensureIndex({"username": 1})

然后再查找user1234

> db.users.ensureIndex({"username": 1})> db.users.find({username: 'user1234'}).explain{    "cursor" : "BtreeCursor username_1","nscannedObjects" : 1,"nscanned" : 1,"nscannedObjectsAllPlans" : 1,"nscannedAllPlans" : 1,"millis" : 0,"indexBounds" : {        "username" : [ [ "user1234","user1234" ]        ]    },"server" : "root:27017"}

的确有点不可思议,查询在瞬间完成,因为通过索引只查找了一条数据,而不是100000条.

当然使用索引是也是有代价的:对于添加的每一条索引,每次写操作(插入、更新、删除)都将耗费更多的时间.这是因为,当数据发生变化时,不仅要更新文档,还要更新级集合上的所有索引.因此,mongodb限制每个集合最多有64个索引.通常,在一个特定的集合上,不应该拥有两个以上的索引.

小技巧

如果一个非常通用的查询,或者这个查询造成了性能瓶颈,那么在某字段(比如username)建立索引是非常好的选择.但只是给管理员用的查询(不太在意查询耗费时间),就不该对这个字段建立索引.

复合索引

索引的值是按一定顺序排列的,所以使用索引键对文档进行排序非常快.

db.users.find.sort({'age': 1,'username': 1})

这里先根据age排序再根据username排序,所以username在这里发挥的作用并不大.为了优化这个排序,可能需要在age和username上建立索引.

db.users.ensureIndex({'age':1,'username': 1})

这就建立了一个复合索引(建立在多个字段上的索引),如果查询条件包括多个键,这个索引就非常有用.

建立复合索引后,每个索引条目都包括一个age字段和一个username字段,并且指向文档在磁盘上的存储位置.此时,age字段是严格升序排列的,如果age相等时再按照username升序排列.

查询方式

点查询(point query)

用于查询单个值(尽管包含这个值的文档可能有多个)

db.users.find({'age': 21}).sort({'username': -1})

因为我们已经建立好复合索引,一个age一个username,建立索引时使用的是升序排序(即数字1),当使用点查询查找{age:21},假设仍然是10万条数据,可能年龄是21的很多人,因此会找到不只一条数据.然后sort({'username': -1})会对这些数据进行逆序排序,本意是这样.但我们不要忘记建立索引时'username':1是升序(从小到大),如果想得到逆序只要对数据从最后一个索引开始,依次遍历即可得到想要的结果.

排序方向并不重要,mongodb可以从任意方向对索引进行遍历.

综上,复合索引在点查询这种情况非常高效,直接定位年龄,不需要对结果进行排序,返回结果.

多值查询(multi-value-query)

db.users.find({'age': {"$gte": 21,"$lte": 30}})

查找多个值相匹配的文档.多值查询也可以理解为多个点查询.

如上,要查找年龄介于21到30之间.monogdb会使用索引的中的第一个键"age"得到匹配的结果,而结果通常是按照索引顺序排列的.

db.users.find({'age': {"$gte": 21,"$lte": 30}}).sort({'username': 1})

与上一个类似,这次需要对结果排序.

在没有sort时,我们查询的结果首先是根据age等于21,age等于22..这样从小到大排序,当age等于21有多个时,在进行usernameA-Z(0-9)这样排序.所以,sort({'username': 1}),要将所有结果通过名字升序排列,这次不得不先在内存中进行排序,然后返回.效率不如上一个高.

当然,在文档非常少的情况,排序也花费不了多少时间.如果结果集很大,比如超过32MB,MongoDB会拒绝对如此多的数据进行排序工作.

还有另外一种解决方案

也可以建立另外一个索引{'username': 1,'age': 1},如果先对username建立索引,当再sortusername,相当没有进行排序.但是需要在整个文档查找age等于21的帅哥美女,所以搜寻时间就长了.

效率高低是分情况的,如果在没有限制的情况下,不用进行排序但需要搜索整个集合时间会远超过前者.但是在返回部分数据(比如limit(1000)),新的赢家就产生了.

>db.users.find({'age': {"$gte": 21,"$lte": 30}}).sort({username': 1}).limit(1000).hint({'age': 1,'username': 1})explain['millis']

2031ms

>db.users.find({'age': {"$gte": 21,"$lte": 30}}).sort({username': 1}).limit(1000).hint({'username': 1,'age': 1}).explain['millis']

181ms

其中可以使用hint指定要使用的索引.

所以这种方式还是很有优势的.比如一般场景下,我们不会把所有的数据都取出来,只是去查询最近的,所以这种效率也会更高.

索引类型

唯一索引

可以确保集合的每个文档的指定键都有唯一值.

db.users.ensureIndex({'username': 1,unique: true})

比如使用mongoose框架,在定义schema时,即可指定unique: true.

如果插入2个相同都叫张三的数据,第二次插入的则会失败._id即为唯一索引,并且不能删除.

稀疏索引

使用sparse可以创建稀疏索引

>db.users.ensureIndex({'email': 1},{'unique': true,'sparse': true})

索引管理

system.indexes集合中包含了每个索引的详细信息

db.system.indexes.find

1.ensureIndex创建索引

db.users.ensureIndex({'username': 1})

后台创建索引,这样数据库再创建索引的同时,仍然能够处理读写请求,可以指定background选项.

db.test.ensureIndex({"username":1},{"background":true})

2.getIndexes查看索引

db.collectionName.getIndexes
db.users.getIndexes[    {        "v" : 1,"key" : { "_id" : 1        },"ns" : "test.users","name" : "_id_"    },{        "v" : 1,"key" : { "username" : 1        },"name" : "username_1"    }]

其中v字段只在内部使用,用于标识索引版本.

3.dropIndex删除索引

> db.users.dropIndex("username_1"){ "nIndexesWas" : 2,"ok" : 1 }

> db.users.dropIndex({"username":1})

欢迎参与《MongoDB入门之索引》讨论,分享您的想法,编程之家PHP学院为您提供专业教程。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


文章浏览阅读552次。com.mongodb.MongoQueryException: Query failed with error code 292 and error message 'Executor error during find command :: caused by :: Sort exceeded memory limit of 104857600 bytes, but did not opt in to external sorting.' on server 11.51.141.63:27017 _mongodb 大文件 下载失败
文章浏览阅读635次,点赞9次,收藏8次。MongoDB 是一种 NoSQL 数据库,它将每个数据存储为一个文档,这里的文档类似于 JSON/BSON 对象,具体数据结构由键值(key/value)对组成。
文章浏览阅读2.1k次。和。_mongodb 日期类型
文章浏览阅读1.7k次。Scalestack等客户期待使用MongoDB Atlas Vector Search和Amazon Bedrock构建下一代应用程序
文章浏览阅读970次。SpringBoot整合中间件mongodb、ES_springboot3 elasticsearch json数据
文章浏览阅读673次。MongoDB 简介_尚医通sql
文章浏览阅读1k次,点赞8次,收藏9次。官网下载MongoDB安装包后进行解压(因了解并不深入,故暂不进行详细说明,自行查找其他安装方法,后期了解深入后将进行该教程的完善)在bin目录下使用命令启动:./mongod --config …/mongodb.conf。该文章任然处于完善中,如果存在错误遗漏的地方,欢迎私信联系。安装相关的nuget包后即可通过以下方法连接数据。YX9010_0@的第二十篇文章。
文章浏览阅读1.2k次,点赞17次,收藏26次。社交场景, 使用 MongoDB 存储存储用户信息, 以及用户发表的朋友圈信息, 通过地理位置索引实现附近的人, 地点等功能.游戏场景, 使用 MongoDB 存储游戏用户信息, 用户的装备, 积分等直接以内嵌文档的形式存储, 方便查询, 高效率存储和访问.物流场景, 使用 MongoDB 存储订单信息, 订单状态在运送过程中会不断更新, 以 MongoDB 内嵌数组的形式来存储, 一次查询就能将订单所有的变更读取出来.物联网场景, 使用 MongoDB 存储所有接入的智能设备信息, 以及设备汇报的日
文章浏览阅读686次。您可以使用 update_one() 方法来更新 MongoDB 中调用的记录或文档。update_one() 方法的第一个参数是 query 对象,用于定义要更新的文档。注释:如果查询找到多个记录,则仅更新第一个匹配项。第二个参数是定义文档新值的对象。_python 更新 mongodb 数据
文章浏览阅读1.3k次。首先来学习一下nosql这里安装就不进行介绍 只记录一下让自己了解mongodb。_nosql注入
文章浏览阅读4.1k次,点赞8次,收藏7次。在data的目录下,创建一个db文件。因为启动MongoDB服务之前必须创建数据库文件的存放文件夹,否则命令不会自动创建,而且不能启动成功。第一步:安装时,Custom是指可以自定义安装路径,然后傻瓜式安装即可(注意:先不要安装图形化工具,否则安装时间会特别长):如果要想连接成功,必须要开服务,即mongod -dbpath C:MongoDBdatadb的cmd要一直开着。然后回车,ctrl+F输入port找到端口号,一般为:27017。打开命令行,然后找到bin文件地址,并输入。_mongodb windows安装
文章浏览阅读5.1k次,点赞3次,收藏43次。详细介绍MongoDB数据库的基本知识,安装方法,基本操作,_mongodb数据库
文章浏览阅读3.2k次。安装教程翻看以往文章。_navicat 连接mongodb
文章浏览阅读426次,点赞9次,收藏12次。win10开放端口:https://blog.csdn.net/m0_43605481/article/details/119255256。我的是阿里云服务器,所以直接在安全组中加入规则,端口范围:27017,授权对象:0.0.0.0。windows在mongodb安装文件夹的bin文件夹中的mongod.cfg。数据库名字是test,打算创建一个用户,账号aaa,密码bbb,权限readWrite。因为该用户是创建在test数据库的,所以在最后要加上test。O了,然后恢复了test的数据。
文章浏览阅读1.1k次。聚合操作主要用于处理数据并返回计算结果。聚合操作将来自多个文档的值组合在一起,按条件分组后,再进行一系列操作(如求和、平均值、最大值、最小值)以返回单个结果。MongoDB的聚合查询​聚合是MongoDB的高级查询语言,它允许我们通过转化合并由多个文档的数据来生成新的在单个文档里不存在的文档信息。MongoDB中聚合(aggregate)主要用于处理数据(例如分组统计平均值、求和、最大值等),并返回计算后的数据结果,有点类似sql语句中的count(*)、groupby。..._如何将几个db的数据统整在一起做查询
文章浏览阅读680次,点赞7次,收藏8次。(2)application.properties配置文件。(4)UserService类。(5)测试和测试结果。
文章浏览阅读1k次,点赞17次,收藏25次。Studio 3T 2023.9 (macOS, Linux, Windows) - MongoDB 的专业 GUI、IDE 和 客户端,支持自然语言查询_mongodb客户端
文章浏览阅读1.1k次,点赞32次,收藏27次。插件式的存储引擎架构可以实现 Server 层和存储引擎层的解耦,可以支持多种存储引擎,如 MySQL 既可以支持 B-Tree 结构的 InnoDB 存储引擎,还可以支持 LSM 结构的 RocksDB 存储引擎。MongoDB 中的记录就是一个 BSON 文档,它是由键值对组成的数据结构,类似于 JSON 对象,是 MongoDB 中的基本数据单元。的简称,是 JSON 文档的二进制表示,支持将文档和数组嵌入到其他文档和数组中,还包含允许表示不属于 JSON 规范的数据类型的扩展。
文章浏览阅读5.1k次,点赞6次,收藏96次。本文设计了一种基于智能室内温度控制的自动调速风扇。以STM32系列单片机为核心主控板,通过程序代码驱动和使用温度传感器模块实现对环境温度的实时监测,并可以实时显示环境温度。同时,可以设置温度检测的上下警告值,根据需求自行调节。_stm32 温控风扇
文章浏览阅读898次,点赞13次,收藏21次。在MongoDB中,我们使用find()和find_one()方法来在集合中查找数据,就像在MySQL数据库中使用SELECT语句来在表中查找数据一样。_pymongo find_one