如何解决从二进制矩阵中消除重复项能比On ^ 2更好的完成时间吗?
| 输入值 [0 1 0 0 1, 1 0 1 1 0, 0 1 0 0 1 1 1 1 0 0] 预期产量 [0 1 0 0 1, 1 0 1 1 0, 1 1 1 0 0] 我能想到的解决方案是: 对于每一行,将它们转换为十进制(或使用某种校验和方法),取O(n) 这实际上将矩阵转换为一维数组。 现在使用哈希表,浏览所有元素 跟踪重复项并仅报告此数组中的唯一元素。 其他解决方案可以包括使用TRIE(或类似结构)。但这仍然需要O(n ^ 2) 有更好的解决方案吗?解决方法
您可以在线性时间内执行以下操作:计算每行的哈希值,然后对BucketSorting the hashs(有史以来最快的整数排序)进行排序,然后从已排序的行中删除重复项(对于每行,将当前行与上一行进行比较,如果(如果匹配),请删除当前)。
编辑:由于每个人都被否决了,显然是有人不了解N项的迭代是线性的,而不管它们是如何排列的,我将详细说明。
Big-O计算不考虑集合在内存中的排列方式,除非存储机制不允许有效地保持恒定的检索时间。数组(无论有多少维)都被视为有效常数,可从中检索。因此,我们应该考虑将整个5x5矩阵视为线性运算,因为它的执行本质上与获得25个对象的一维数组相同。
顺便说一句:
对所有元素进行一次哈希处理是一次线性的,因为我们需要读取每个元素一次才将它们添加到该行的哈希中(这就像将每个元素乘以10 ^ x或2 ^ x一样简单并添加到运行总计中)。
BucketSort算法对X元素的一维数组(最大数量级为M)执行X * M时间。因为在这种情况下,X是整个操作总N的平方根,而最坏情况下的最大阶M的大小也将是N的平方根,我们的BucketSort将在O(X * M)〜= O(N)最坏的情况下执行。
迭代经过排序的哈希是线性的,大约等于我们总N的平方根。
因此,在N个值的矩阵上执行的该算法的总复杂度大约为O(2N + sqrt(N)),被视为O(N)。
, 为什么不将二进制值存储在整数中(就像您将位字段存储在一起),然后使用快速或合并排序对整数进行排序。然后遍历排序的列表以检查重复项。由于重复的值已排序,因此它们始终总是直接相邻。这将花费O(n log n + n),其中n是矩阵中的行数。但是,每个操作都将非常快,因为它将由一个整数的比较,交换和相等检查组成,这在现代硬件上非常快。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。