微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

cassandra – 如何处理非规范化数据的变化

在包含副本的表中更新未索引的常规列(不是主键相关)的最佳方法是什么?

即用户发布了一些内容,并且该帖子在许多表中都是重复的,以便快速检索.但是当该帖子发生更改(使用编辑)时,需要在包含该帖子的所有表中(在具有不同和未知主键的表中)更新整个数据库.

我正在考虑的解决方案:

>有一个映射器表来跟踪所有这些表中的主键,但它似乎导致表爆炸(post不是唯一可能更改的属性).
>使用Solr进行映射,但我担心我会将它用于错误的目的.

任何启发将不胜感激.

编辑(虚构架构).

如果帖子发生变化怎么办?甚至是用户的display_name?

CREATE TABLE users (
    id uuid,display_name text,PRIMARY KEY ((id))
);

CREATE TABLE posts (
    id uuid,post text,poster_id uuid,poster_display_name text
    tags set<text>,statistics map<int,bigint>,PRIMARY KEY ((id))
);

CREATE TABLE posts_by_user (
    user_id uuid,created timeuuid,post_id uuid,tags set<text>,PRIMARY KEY ((id),created)
);

解决方法

这取决于更新的频率.例如,如果用户不经常更新他们的名字(每个用户帐户少数时间),那么可以使用二级索引.只要知道使用2i是一个分散集合,所以如果它是一个常见的操作,你会看到性能问题.在这些情况下,您将需要使用物化视图(3.0中的视图或自己管理)以获取给定用户的所有帖子的列表,然后更新用户的显示名称.

我建议在后台工作中执行此操作,并向用户发送一条消息,例如“可能需要[某个时间单位]才能将您名称的更改反映到任何地方”.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐