如何解决在列表中查找可能包含任意重复次数的重复数字的算法
|| 在将其作为重复项关闭之前,请仔细阅读此问题,尽管如果它是诚实的重复项,我很乐意知道。这是查找列表中多个可能重复整数中的任何一个的概括。 给定任意N个集合S 整数,以及的任何数组A 长度N + 1,每个项为 取自S,什么是最好的 找到一些算法(必须有 至少一个)重复输入A? 注意:A中可能有多个重复的条目,并且任何条目都可以重复多次。 正如Nemo所指出的那样,平凡的解需要O(1)空间和O(N ^ 2)时间。我正在寻找一种解决方案,该解决方案可以节省时间,又不会过多地占用空间。确切地说,我正在寻找的解决方案是: 返回至少在A中出现两次的值a, 在不修改A的情况下最多使用O(log N)空间,并且 花费不到O(N ^ 2)的时间 编辑:集合S在那里确保数组A具有至少一个重复的条目。对于此问题,请不要以为您已将S作为有序集合给予您。您可以查询S(布尔值返回S中的true
是s,否则返回false
),您可以查询A(调用A [i]),仅此而已。任何对A或S排序的解决方案都超过了空间限制。
这种概括使我对原始问题(具有O(1)空间和O(N)时间)的指针解决方案无效,而我施加的空间约束使fiver's解决方案(具有O(N)空间和时间)。
解决方法
该算法类似于贾斯汀·西蒙(Justin Simon)的算法,但关键是如何仅使用O(1)空间有效地计算S的中值(或第k个元素)。
这是密钥算法,它是随机的:
将lower设置为等于S的最小元素,将upper等于S的最大元素。从S中选择一个介于lower和upper之间的随机元素x(这最多花费了O(n)个预期时间)。计算x的秩(O(n)时间)。如果x的等级太低,则将其设置为x的后继(O(n)时间),否则将其设置为等于x的前继(O(n)时间)。重复直到下等于上。
请注意,每次迭代的期望值为O(n),并且期望的迭代次数为O(lg n),因此,由于我们仅存储上下两层,因此预期的时间成本为O(n lg n),空间使用量为O(1)。
利用选择第k个元素的能力,我们可以使用原始问题中建议的信鸽原理,通过对A和O进行O(lg n)线性扫描,找到越来越小的S段,其中S的段包含太多的元素以至于无法区分。 O(1)空间,用于存储每个区域中元素的相关总和。除了找到第k个元素的O(n lg n)成本外,每个此类迭代的成本为O(n),并且有O(lg n)迭代,因此总成本为O(n lg ^ 2 n)。
, 找到N个整数的集合S的中点(如果它们是连续的,则这是微不足道的,否则可以在O(logn)中完成)。
遍历列表A,计算小于该中点的条目数。因此,您在A中的条目要比中点少,而不是S中有相同的相同数字;或者您在A中的条目要比中点少,等等。在前一种情况下,请使输入少于中点再重复一次,在后者中取大于或等于它的那些。
我相信,这种解决方案可以在n(log(n))^ 2的时间内工作。
, 在数组中查找重复元素的作者建议,即使分配一个位数组来表示每个可能的整数(一个易于管理的2 ^ 24字节位数组也会为每个32位整数提供一个位)被定义为使用O(1)空间,我倾向于同意。
因此,测试和设置代表数组中找到的每个整数的位并返回重复的整数(如果该位已设置)的最简单的可能算法将运行O(n)时间并使用O(1)空间。
, 如果可以更改数组,我认为可以使用O(n)时间和O(1)额外空间的就地存储桶排序来实现。
具体来说,遍历列表中的每个元素。对于每个元素,检查该数字是否等于索引。如果不是,则用索引中的元素替换该数字,直到索引和数字相同。如果您在新索引中看到相同的数字,则表示重复。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。