如何解决C ++:为什么unordered_set :: find比find更快?
当我执行unordered_set :: find
时unordered_set<int> uniqueNum;
//code...
if(uniqueNum.find(num + k) != uniqueNum.end())
//code ...
此代码的运行时间比
更快unordered_set<int> uniqueNum;
//code...
if(find(uniqueNum.begin(),uniqueNum.end(),num + k) != uniqueNum.end())
//code...
根据参考,unordered_set :: find为“最坏的情况:容器尺寸呈线性” find是“第一个和最后一个之间的距离最大:比较元素直到找到匹配项” 。
它们不是相同的运行时吗?为什么在运行代码时unordered_set :: find更快?是std :: find在我不知道的事情背后做了什么吗?
解决方法
这是由于它们的实现方式。 std::find
会按预期运行。从头开始,比较每个元素,直到到达末尾。这是相当普遍的,但不会从所使用的特定数据结构中受益。但是,unordered_set
是一个哈希集,因此,如果没有哈希冲突,则每个元素将花费相同的时间来查找。
之所以说“容器大小是线性的最坏情况”,是因为如果哈希表的长度为1,则每个条目都将放在表中的相同位置(伪代码:{{ 1}})。如果发生这种情况,则根据实现的不同,最终可能看起来更像是内存中的列表,并且必须顺序检查每个项目。但是实际上,这可能永远不会发生。
,无序集就像文件柜。假设您拥有公司所有员工的文件。文件柜有26个抽屉,每个抽屉都标有一个字母。每个员工的记录都按姓氏的第一个字母存储。抽屉中的文件没有进一步的组织。
当告诉unordered_set::find
查找员工的记录时,它会直接转到标有姓氏首字母的抽屉中,并在该抽屉中搜索所有记录。当std::find
被赋予相同的任务时,它将从左上角的抽屉开始并检查其中的所有记录,然后再移至其旁边的抽屉,依此类推,直到所有抽屉都被检查或记录被找到了。 (请注意,左上角的抽屉不一定是“ A”。)
假设公司有20名员工。给定一个典型的名称分布,unordered_set::find
可能会进入一个正好有一个记录的抽屉,这将是您要查找的记录。也许它找到两个记录。仍然快速简便。如果您的哈希函数可以胜任任务,则这是常见情况。同时,std::find
可能必须浏览所有记录以找到您要查找的记录。有时候它很幸运,马上就找到了。平均而言,它将浏览一半的记录。
但是,典型情况并非最坏情况。最糟糕的情况是,该公司的最后一次招聘是在家庭聚会上进行的,因此所有20名员工都被称为“琼斯”。通常快的unordered_set::find
将使抽屉“ J”成为一条直线,仅是找到该抽屉中的每个员工记录。在找到所需记录之前,它将平均浏览一半的记录,与std::find
相同。
您应该关心典型时间还是最坏情况?这取决于您的特定情况。有时,有系统的原因会陷入最坏的情况,类似于在家庭聚会中招募。另一方面,如果名称是随机分布的,则在此示例中,同一抽屉中有10条(或更多)记录的机会约为5×10 12 中的1;真正最糟糕的情况甚至更罕见(涉及10 26 )...。通常,您可以指望快速查找。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。