从二进制矩阵中消除重复项能比On ^ 2更好的完成时间吗？

如何解决从二进制矩阵中消除重复项能比On ^ 2更好的完成时间吗？

| 输入值 [0 1 0 0 1， 1 0 1 1 0， 0 1 0 0 1 1 1 1 0 0] 预期产量 [0 1 0 0 1， 1 0 1 1 0， 1 1 1 0 0] 我能想到的解决方案是：对于每一行，将它们转换为十进制（或使用某种校验和方法），取O（n）这实际上将矩阵转换为一维数组。现在使用哈希表，浏览所有元素跟踪重复项并仅报告此数组中的唯一元素。其他解决方案可以包括使用TRIE（或类似结构）。但这仍然需要O（n ^ 2）有更好的解决方案吗？

解决方法

您可以在线性时间内执行以下操作：计算每行的哈希值，然后对BucketSorting the hashs（有史以来最快的整数排序）进行排序，然后从已排序的行中删除重复项（对于每行，将当前行与上一行进行比较，如果（如果匹配），请删除当前）。编辑：由于每个人都被否决了，显然是有人不了解N项的迭代是线性的，而不管它们是如何排列的，我将详细说明。 Big-O计算不考虑集合在内存中的排列方式，除非存储机制不允许有效地保持恒定的检索时间。数组（无论有多少维）都被视为有效常数，可从中检索。因此，我们应该考虑将整个5x5矩阵视为线性运算，因为它的执行本质上与获得25个对象的一维数组相同。顺便说一句：对所有元素进行一次哈希处理是一次线性的，因为我们需要读取每个元素一次才将它们添加到该行的哈希中（这就像将每个元素乘以10 ^ x或2 ^ x一样简单并添加到运行总计中）。 BucketSort算法对X元素的一维数组（最大数量级为M）执行X * M时间。因为在这种情况下，X是整个操作总N的平方根，而最坏情况下的最大阶M的大小也将是N的平方根，我们的BucketSort将在O（X * M）〜= O（N）最坏的情况下执行。迭代经过排序的哈希是线性的，大约等于我们总N的平方根。因此，在N个值的矩阵上执行的该算法的总复杂度大约为O（2N + sqrt（N）），被视为O（N）。 , 为什么不将二进制值存储在整数中（就像您将位字段存储在一起），然后使用快速或合并排序对整数进行排序。然后遍历排序的列表以检查重复项。由于重复的值已排序，因此它们始终总是直接相邻。这将花费O（n log n + n），其中n是矩阵中的行数。但是，每个操作都将非常快，因为它将由一个整数的比较，交换和相等检查组成，这在现代硬件上非常快。

从二进制矩阵中消除重复项能比On ^ 2更好的完成时间吗？

如何解决从二进制矩阵中消除重复项能比On ^ 2更好的完成时间吗？

解决方法

相关推荐