gStore 面向 RDF 知识图谱的图数据库系统

程序名称:gStore

授权协议: BSD-3-Clause

操作系统: 跨平台

开发语言: C/C++

gStore 介绍

gStore是一个面向RDF知识图谱的图数据库系统(通常称为Triple Store)。

知识图谱数据管理的一个核心问题是如何有效地存储RDF数据集和快速回答SPARQL查询。总的来说,有两套完全不同的思路。其一是可以利用已有的成熟的数据库管理系统(例如关系数据库系统)来存储知识图谱数据,将面向RDF知识图谱的SPARQL查询转换为面向此类成熟数据库管理系统的查询,例如面向关系数据库的SQL查询,利用已有的关系数据库产品或者相关技术来回答查询。这里面最核心的研究问题是如何构建关系表来存储RDF知识图谱数据,并且使得转换的SQL查询语句查询性能更高;其二是直接开发面向RDF知识图谱数据的Native的知识图谱数据存储和查询系统(Native
RDF图数据库系统),考虑到RDF知识图谱管理的特性,从数据库系统的底层进行优化。

不同于传统基于关系数据库的知识图谱数据管理方法,gStore原生基于图数据模型(Native Graph
Model),维持了原始RDF知识图谱的图结构;其数据模型是有标签、有向的多边图,每个顶点对应着一个主体或客体。gStore系统将RDF和SPARQL分别表示成图的形式,利用子图匹配的方法来回答SPARQL查询,并且利用基于图结构的索引(VS-
tree
)来加速查询的性能。
例如在RDF中,主体和客体可以分别表示成RDF图中的节点,一条称述(即RDF三元组)可以表示成一条边,其中谓词是边的标签。SPARQL语句同样可以表示成一个查询图。

RDF图和SPARQL查询图

gStore图数据库的优势:

  1. 拥有自主研发的核心图数据库系统技术;
  2. 对RDF知识图谱数据文件原生支持;
  3. 引擎对于图查询/分析的原生支持;
  4. 支持描述性(而非过程化)查询语言;
  5. 性能:秒级多跳查询;
  6. 支持跨复杂数据的关联分析。

性能测试

国家权威的第三方软件测评机构对gStore性能进行了对比测试,测试结果表明在国际通用的图数据评测数据集上,与Neo4j,Virtuoso,Jena,JanusGraph等4种目前市场上主流图数据库进行了对比测试,测试结果表明gStore的数据查询性能具有明显优势。

中国软件测评中心对分布式gStore存储容量和gStore的查询性能进行了严格测试,验证了分布式gStore支持百亿规模三元组数据,且平均查询响应时间仅为1.797秒。

gStore 拥有以下特性:

  1. gStore从图数据库角度存储和检索RDF知识图谱数据;
  2. gStore支持W3C定义的SPARQL 1.1标准,包括含有Union,OPTIONAL,FILTER和聚集函数的查询;gStore支持有效的增删改操作;
  3. gStore单机可以支持1Billion(十亿)三元组规模的RDF知识图谱的数据管理任务;

关于gStore的核心学术思路,请参考gStore所发表的论文

gStore 应用案例

gStore可下载资源

  1. gStore(单机版):http://www.gstore-pku.com/pcsite/download-1.html
  2. gStore Workbench:http://www.gstore-pku.com/pcsite/download-2.html
  3. gStore云端:http://cloud.gstore.cn/

gStore 官网

http://www.gstore-pku.com/pcsite/index.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


SchemaCrawler提供一组用于增强标准JDBC Metadata的API.SchemaCrawler还包含一个命令行工具能够将数据库结构和数据以一种易读的形式输出.
ER Master 是一个用于设计ER模型图的Eclipse插件。提供的功能包括:从数据库导入关系生成ER图,导出设计图,导出DDL数据定义语句等。目前完整支持的数据库包括
Eclipse下用于画数据库ER图的插件,主要特性如下: 图形化编辑ER图 从数据库结构中导入ER图
PowerDesigner 是Sybase的企业建模和设计解决方案,采用模型驱动方法,将业务与IT结合起来,可帮助部署有效的企业体系架构,并为研发生命周期管理提供强大的分析与设计技术。PowerDesigner
Mogwai ERDesigner NG是一个实体关系建模工具类似于ERWin。它设计成让数据库建模变得尽可能简易并为整个开发过程提供支持,从数据库设计到模式
Power*Architect 是一个数据建模工具,主要用在数据仓库和数据集市的模型设计。
MySQL Workbench是一款专为MySQL设计的ER/数据库建模工具。它是著名的数据库设计工具DBDesigner4的继任者。你可以用MySQL
DbWrench 是一个数据库设计和同步软件,为数据库开发人员提升生产率,可轻松的创建和修改数据库。
是一个采用Python开发的使用ER图的数据库建模工具
CA公司的数据库建模工具 (非开源) ,为你提供一个易于使用的用户界面(UI)环境,简化数据库设计过程,并将许多令人疲惫的任务自动化,如创建高性能事务和数据仓库数据库。这是一款可以和PowerDesigner并驾齐驱的
Altova MapForce® 2008是您首选的数据综合和网络服务器实现工具。它可以通过映射数据源到WSDLO操作的方法,实现多种文件之间的转化,包括XML文件, 数据库文件,
一个用Java开发的可视化数据库设计工具,支持JDBC 2.0的数据库
一个图形化的数据库模型浏览工具,SchemaSpy analyzes database metadata to reverse engineer
从事软件开发多年,感觉数据库在整个软件开发过程中扮演一个不可或缺的角色。一旦一个业务项目进入立项阶段,需要支持哪些数据库平台,如何使用该种数据库平台都将成为架构师需要考虑的内容,对于一般的开发人员,
Middlegen一个免费数据库驱动(database-driven)的代码生成引擎。它基于JDBC,Velocity,Ant和XDoclet.
Ermodeller是一个用于数据建模的CASE工具。该工具支持概念建模和逻辑建模,并在最后生成特定数据库的物理模型。支持的数据库包括:MySQL、PotgreSQL、Oracle、Pointbase,对其它数据库的支持需要通过XML文件自定义
GMOD is the G eneric M odel O rganism D atabase project, a collection of open source software tools for creating and managing genome-
pgDesigner 是一个为PostgreSQL数据库设计的建模工具
Enterprise Architect是一款计算机辅助软件工程(CASE)工具,用于设计和构建软件系统、业务流程建模及更多通用的建模。
mybatis 通用 basedao,含自动生成通用 XMLMapper。 可通过此工具自动生成 Mybatis XML 文件和 dao 的 class 类