如何解决持久数据结构的有效批量修改
| 我了解通常如何使用树来修改持久数据结构(创建一个新节点并替换其所有祖先)。 但是,如果我有一棵拥有10,000个节点的树并且需要修改其中1000个节点,该怎么办?我不想遍历并创建1000个新的根,我只需要一个可以立即修改所有内容的新根。 例如: 让我们以一个持久的二叉树为例。在单个更新节点的情况下,它会进行搜索,直到找到该节点,然后使用修改的内容和旧的子节点创建一个新节点,并创建直到根节点的新祖先。 在批量更新的情况下,我们可以这样做: 您将要一次性更新1000个节点,而不仅仅是更新单个节点。 在根节点上,当前列表是完整列表。然后,您可以在与左侧节点匹配的列表和与右侧节点匹配的列表之间进行拆分。如果没有一个与孩子之一匹配,请不要下降。然后,您下降到左侧节点(假设存在匹配项),在其子级之间拆分其搜索列表,然后继续。当您有一个节点和一个匹配项时,可以对其进行更新并进行备份,并根据需要替换和更新祖先和其他分支。 即使修改了任意数量的节点,这也只会导致一个新的根。解决方法
这种“大量修改”操作有时称为批量更新。当然,具体细节将根据所使用的数据结构类型以及尝试执行的修改类型而有所不同。
典型的操作类型可能包括“删除满足某个条件的所有值”或“增加与此列表中所有键关联的值”。通常,这些操作可以在整个结构上进行一次遍历,而花费的时间为O(n)。
您似乎担心创建“ 1000个新根目录”所涉及的内存分配。一次执行一次操作的典型分配为O(k log n),其中k是要修改的节点数。用于在整个结构上执行单个遍历的典型分配为O(n)。哪个更好取决于k和n。
在某些情况下,您可以通过特别注意更改发生的时间来减少分配的数量(以更复杂的代码为代价)。例如,如果您有一个返回树的递归算法,则可以修改该算法以返回一个树以及一个布尔值,该布尔值指示是否有任何更改。然后,该算法可以在分配新节点之前检查那些布尔值,以查看旧节点是否可以安全地重用。但是,除非有证据表明额外的内存分配实际上是一个问题,否则人们通常不会为这项额外的检查感到烦恼。
,您要查找的内容的特定实现可以在Clojure(和ClojureScript)的瞬态中找到。
简而言之,给定一个完全不变的持久性数据结构,它的一个临时版本将使用破坏性(分配效率高的)突变进行更改,当您完成处理后,您可以再次将其恢复为适当的持久性数据结构性能敏感的操作。仅在过渡回持久数据结构时,才会创建新的根目录(例如),从而将您在结构处于过渡形式时对结构执行的逻辑操作的数量分摊给伴随的成本。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。