如何解决如何提高Neo4j关系创建查询的性能
我正在处理一个相对较小的数据集,我使用Python脚本收集了该数据集,然后将其写入Neo4j数据库以进行快速访问。大约有20000个节点,这些节点之间大约有500万个关系。收集Python中的数据并在几分钟之内放入字典中,然后我遍历整个字典一次以插入所有节点,再一次插入所有关系。这两个动作都包含一个交易。
正如我提到的,收集数据需要几分钟,编写节点也需要几分钟。但是,创建这些关系要花很多时间(我上次检查15个小时)。我想知道如何提高这些查询的性能,也许有一些明显的问题我正在忽略,或者也许有些我不熟悉的“交易技巧”。
有问题的密码查询如下:
CREATE(node: Model { name: 'example',path: 'example'})
MATCH (parent:Model {name: '',path: ''}),(child1:Model {name: '',(child2:Model {name: '',(child3:Model {name: '',path: ''})
MERGE (child1)-[r1:DEPENDS_ON]->(parent),MERGE (child2)-[r2:DEPENDS_ON]->(parent),MERGE (child3)-[r3:DEPENDS_ON]->(parent)
编辑1 因此,仅是进行更新,问题仍然存在,我觉得我应该提供一些其他信息。
- 名称和路径上有一个复合索引,这两个字段在一起是唯一的
- 据我所知,在我的查询中,每个字段仅被发现一次(因此没有基数问题)
编辑2 我已经执行并测试了一个查询,它由大约70个孩子与一个单亲建立关系(大约71个匹配查询)。通过Python脚本执行此查询所产生的总运行时间为 12秒,而在neo4j桌面上,该运行时间仅需 3毫秒。
如果有人有任何改进建议,将非常欢迎。我唯一能想到的就是创建某种唯一密钥,在其上添加索引,并仅通过一个字段来查找模型。但是话又说回来,这真的会带来多大的改变?谢谢大家。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。