从JanusGraph删除具有百万度缩放比例的顶点

如何解决从JanusGraph删除具有百万度缩放比例的顶点

  • 我正在将Janusgraph与Scylla作为存储引擎一起运行。
  • 该图的顶点的度为5M(从内到外),即大约有5M个顶点与之相连,
  • 我正在尝试通过gremlin查询graph.traversal().V(vertexId).drop().iterate()删除此顶点,但是这花费了很多时间(无法在20分钟内删除)。
  • 我了解上面的查询会迭代所有边缘并进行实际删除

我想知道是否有人遇到过类似的问题,并想出了解决办法。任何线索都会真正有帮助。

解决方法

我的信息可能已过时,也许有修改的方法可以执行此操作,但是由于对此问题没有任何答复,我认为我会提供我所知道的建议。在JanusGraph出现之前的几天,这张图被称为Titan,我遇到了类似您所描述的情况,我发现在进行直接g.V(id).drop()时会发现类似的结果,并且该结果完全摆脱了该大小的顶点意味着要有耐心。我用来摆脱它的策略包括修剪其边缘的顶点,以便可以删除顶点本身。

如何修剪边缘取决于您的数据以及这5M边缘的构成方式。可以很简单,只需按标签或一次在每个标签中按10000个块进行操作,或将过程分解为大块的其他有意义的事情。

while(g.V(vertexId).outE('knows').limit(1).hasNext()) {
    g.V(vertexId).outE('knows').limit(10000).drop().iterate();
}

我想我记得我能够并行运行这些类型的操作,这使该过程有所加快。无论如何,当顶点的所有边缘都没有(或者至少减小到较小的度数)时,您可以g.V(vertexId).drop()并告别它。

我没有使用ScyllaDB,但我想我记得很多删除操作都会给Cassandra造成逻辑删除类型的问题,因此值得一提。您可能还会考虑增加在此过程中可能发生的各种超时。

对于我来说,多年来我就此问题吸取的教训是建立基于OLAP的监视器,该监视器跟踪图形统计信息,以确保图形中具有适当的预期增长(即度分布,标签分布,等等)。这对于从诸如Kafka之类的大流量流中馈送的图形来说尤其重要,您可以在其中转过头几个小时然后回来,发现图形处于丑陋的意外状态。我认为以能够解决这些超级节点状态的可能性的方式进行建模也很重要。在许多情况下,边缘TTL和单向边缘都可以帮助解决问题。

我很想听听这个答案不再相关,并且有一些新颖的新方法可以执行此类丢弃操作,或者有一些ScyllaDB特定方法可以解决此问题,但是,如果没有,也许这将是对您有用,并帮助您解决问题。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


依赖报错 idea导入项目后依赖报错,解决方案:https://blog.csdn.net/weixin_42420249/article/details/81191861 依赖版本报错:更换其他版本 无法下载依赖可参考:https://blog.csdn.net/weixin_42628809/a
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下 2021-12-03 13:33:33.927 ERROR 7228 [ main] o.s.b.d.LoggingFailureAnalysisReporter : *************************** APPL
错误1:gradle项目控制台输出为乱码 # 解决方案:https://blog.csdn.net/weixin_43501566/article/details/112482302 # 在gradle-wrapper.properties 添加以下内容 org.gradle.jvmargs=-Df
错误还原:在查询的过程中,传入的workType为0时,该条件不起作用 <select id="xxx"> SELECT di.id, di.name, di.work_type, di.updated... <where> <if test=&qu
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct redisServer’没有名为‘server_cpulist’的成员 redisSetCpuAffinity(server.server_cpulist); ^ server.c: 在函数‘hasActiveC
解决方案1 1、改项目中.idea/workspace.xml配置文件,增加dynamic.classpath参数 2、搜索PropertiesComponent,添加如下 <property name="dynamic.classpath" value="tru
删除根组件app.vue中的默认代码后报错:Module Error (from ./node_modules/eslint-loader/index.js): 解决方案:关闭ESlint代码检测,在项目根目录创建vue.config.js,在文件中添加 module.exports = { lin
查看spark默认的python版本 [root@master day27]# pyspark /home/software/spark-2.3.4-bin-hadoop2.7/conf/spark-env.sh: line 2: /usr/local/hadoop/bin/hadoop: No s
使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams['font.sans-serif'] = ['SimHei'] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -> systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping("/hires") public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate<String
使用vite构建项目报错 C:\Users\ychen\work>npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-