C ++：为什么unordered_set :: find比find更快？

如何解决C ++：为什么unordered_set :: find比find更快？

当我执行unordered_set :: find

时

unordered_set<int> uniqueNum;

//code...
if(uniqueNum.find(num + k) != uniqueNum.end()) 
//code ...

此代码的运行时间比

更快

unordered_set<int> uniqueNum;
        
//code...
if(find(uniqueNum.begin(),uniqueNum.end(),num + k) != uniqueNum.end()) 
//code...

根据参考，unordered_set :: find为“最坏的情况：容器尺寸呈线性” find是“第一个和最后一个之间的距离最大：比较元素直到找到匹配项” 。

它们不是相同的运行时吗？为什么在运行代码时unordered_set :: find更快？是std :: find在我不知道的事情背后做了什么吗？

解决方法

这是由于它们的实现方式。 std::find会按预期运行。从头开始，比较每个元素，直到到达末尾。这是相当普遍的，但不会从所使用的特定数据结构中受益。但是，unordered_set是一个哈希集，因此，如果没有哈希冲突，则每个元素将花费相同的时间来查找。

之所以说“容器大小是线性的最坏情况”，是因为如果哈希表的长度为1，则每个条目都将放在表中的相同位置（伪代码：{{ 1}}）。如果发生这种情况，则根据实现的不同，最终可能看起来更像是内存中的列表，并且必须顺序检查每个项目。但是实际上，这可能永远不会发生。

无序集就像文件柜。假设您拥有公司所有员工的文件。文件柜有26个抽屉，每个抽屉都标有一个字母。每个员工的记录都按姓氏的第一个字母存储。抽屉中的文件没有进一步的组织。

当告诉unordered_set::find查找员工的记录时，它会直接转到标有姓氏首字母的抽屉中，并在该抽屉中搜索所有记录。当std::find被赋予相同的任务时，它将从左上角的抽屉开始并检查其中的所有记录，然后再移至其旁边的抽屉，依此类推，直到所有抽屉都被检查或记录被找到了。（请注意，左上角的抽屉不一定是“ A”。）

假设公司有20名员工。给定一个典型的名称分布，unordered_set::find可能会进入一个正好有一个记录的抽屉，这将是您要查找的记录。也许它找到两个记录。仍然快速简便。如果您的哈希函数可以胜任任务，则这是常见情况。同时，std::find可能必须浏览所有记录以找到您要查找的记录。有时候它很幸运，马上就找到了。平均而言，它将浏览一半的记录。

但是，典型情况并非最坏情况。最糟糕的情况是，该公司的最后一次招聘是在家庭聚会上进行的，因此所有20名员工都被称为“琼斯”。通常快的unordered_set::find将使抽屉“ J”成为一条直线，仅是找到该抽屉中的每个员工记录。在找到所需记录之前，它将平均浏览一半的记录，与std::find相同。

您应该关心典型时间还是最坏情况？这取决于您的特定情况。有时，有系统的原因会陷入最坏的情况，类似于在家庭聚会中招募。另一方面，如果名称是随机分布的，则在此示例中，同一抽屉中有10条（或更多）记录的机会约为5×10 ¹²中的1；真正最糟糕的情况甚至更罕见（涉及10 ²⁶）...。通常，您可以指望快速查找。

C ++：为什么unordered_set :: find比find更快？

如何解决C ++：为什么unordered_set :: find比find更快？

解决方法

相关推荐