如何解决如何使用应用程序实例B删除存储在应用程序实例A的状态存储区中的键/值
据我了解,状态存储在每个应用程序实例(例如分区)中都是本地的....
由于Kafka Streams对数据进行分区以进行处理,因此应用程序的整个状态分布在应用程序运行实例的本地状态存储中。
我有一个用例,其中我只需要拥有包含特定值的任意键(我们将其称为value123)即可。如果收到另一个keyB / value123消息,并且value123相同,但是以前具有不同的密钥(keyD),则需要删除旧的keyD / value123。
这是问题所在-我只收到新的键/值关联。我没有收到有关旧键的“逻辑删除”消息-因此,我必须暗示该逻辑删除,因为新的密钥刚刚到达具有相同值的主题。如果键/值位于另一个应用程序实例的状态存储中,则无法访问(删除)键/值,因为状态在每个实例中都是本地的。我需要逐出旧数据。我该如何实现?
以另一种方式看待它:
如果带有密钥A的消息进入转换器,并且该转换器的工作是清理状态,以确保其他任何密钥都不具有该值...假设密钥A的值当前已“关联”到密钥B。需要从KTable /状态存储中删除键B,以便键A现在可以是唯一与值相关联的东西。我不能保证将密钥B与密钥A分配到同一分区。如何从密钥A的分区中删除密钥B。
解决方法
Kafka Streams应用程序的实例可以使用RPC-https://kafka.apache.org/10/documentation/streams/developer-guide/interactive-queries.html#querying-remote-state-stores-for-the-entire-app进行通信。
您可以通过创建自定义RPC端点并构建逻辑以从远程状态存储中删除值(如果找到)来查询其他实例。
,我能够通过将密钥切换到另一个数据点并使用新的2.5.0功能通过外键联接2个ktable来解决我的问题。这将控制输出,因为一旦新记录使用相同的键(但使用不同的外键)进入,由于外键已更改,我的另一个ktable将不会加入。
我将这两个用作资源:
https://kafka-tutorials.confluent.io/foreign-key-joins/kstreams.html
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。