如何解决使用Cassandra
我有一个搜索服务,可以将最近1分钟的查询频率写入Cassandra,如下所示。现在,我需要汇总最近1小时的频率,即计算最近1小时的每个查询的频率总和。
假定1小时窗口中的唯一查询数为500万。现在,我有三个聚合节点,它们从cassandra中读取,进行聚合并将其写回到另一个表中。
但是我不确定如何在聚合器节点之间分配工作负载,即如何协调工作?每条记录应仅由一个节点处理。如果是sql,也许我可以使用事务来自动读取数百条记录并将其标记为正在处理。但是我不知道如何在cassandra中实现这一目标。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。