【重磅】Apache InLong(incubating) 发布 0.10.0 版本

 

| 导语 Apache InLong 以腾讯内部使用的 TDBank 为原型,依托万亿级别的数据接入和处理能力,整合了数据采集、汇聚、存储、分拣数据处理全流程,拥有简单易用、灵活扩展、稳定可靠等特性。

 

Apache InLong(incubating) 刚刚发布了 0.10.0 版本,该版本是升级为 InLong(应龙) 后的第二个版本,着力解决 InLong 应用门槛高问题。该版本吸引腾讯内外 10 多位开发者参与,关闭超过 120 个 issue, 开发超过 8 个重要 Feature。

Apache InLong(incubating) 简介 

Apache InLong(应龙)是腾讯捐献给 Apache 社区的一站式数据流接入服务平台,提供自动、安全、高性能、分布式的数据发布订阅能力,基于该系统用户可以轻松构建基于流式的数据应用。InLong 项目原本叫 TubeMQ ,专注高性能、低成本的消息队列服务。为了进一步释放 TubeMQ 周边生态能力,我们将项目升级为 InLong ,专注打造一站式数据流接入服务平台。

 

Apache InLong 以腾讯内部使用的 TDBank 为原型,依托万亿级别的数据接入和处理能力,整合了数据采集、汇聚、存储、分拣数据处理全流程,拥有简单易用、灵活扩展、稳定可靠等特性。

 

 

Apache InLong 服务于数据采集到落地的整个生命周期,按数据的不同阶段提供不同的处理模块,主要包括:

  • inlong-agent ,数据采集 Agent ,支持从指定目录或文件读取常规日志,进行逐条的数据上报。后续也将扩展 DB 采集,扩展 HTTP 上报等能力。

  • inlong-dataproxy ,一个基于 Flume-ng 的 Proxy 组件,支持数据发送阻塞、落盘重发,拥有将接收数据后转发到不同 MQ(消息队列)的能力。

  • inlong-tubemq ,腾讯自研的消息队列服务,专注服务大数据场景下海量数据的高性能存储和传输,在海量实践和低成本方面有着比较好的核心优势。

  • inlong-sort ,从不同的 MQ 消费数据后进行 ETL 处理,然后将数据汇聚并写入 Hive、ClickHouse、Hbase、IceBerg 等。

  • inlong-manager ,提供完整的数据服务管控能力,包括元数据、OpenAPI、任务流、权限等。

  • inlong-website ,一个用于管理数据接入的前端页面,简化整个 InLong 管控平台的使用。

 

Apache InLong(incubating) 0.10.0 版本简介

我们从上个版本( 0.9.0 )始,将 TubeMQ 升级为 InLong ,第一次将全链路数据接入能力开源出来。随着 0.9.0 发布后,我们组织了一次线上 Meetup ,探讨了大家在初次尝鲜 InLong 过程当中遇到的问题,发现大多数同学反馈 InLong 的“使用门槛太高,部署难度太大”。InLong 包括 6 个模块,并且每个模块拥有单独的编译打包、配置、启停脚本,完整的使用 InLong 还依赖 MySQL、Hive、Flink 集群等第三方服务组件,真正把 InLong 用起来的社区用户寥寥无几。

 

为了解决社区用户反馈的”开头难“问题, 我们将 0.10.0 版本开发目标设定为“降低 InLong 使用门槛,方便社区用户用起来”,在新版本中主要完成了以下几个方面的工作,来简化 InLong 的安装和使用:

  • 所有组件 Docker 化,提供一键安装能力

  • 进一步整合 InLong 所有模块,简化模块配置

  • 提供 Example Demo ,手把手教如何使用 InLong

 

Apache InLong(incubating) 0.10.0 版本主要特性

3.1 全面拥抱 GitHub

在之前版本,InLong 的所有 Issue 由 Jira 管理,提交新的 PR 需要在 Jira 和 GitHub 来回跳转。同时,由于 Jira 和 GitHub 账号不通,新的贡献者需要先单独注册 Jira 账号和配置权限。在最近发布的 0.10.0 版本中,我们将 Jira Issue 历史迁移到了 GitHub Issue ,并设置了配套的 Issue 模板,方便开发者创建 Issue 和关联 PR 。同时,我们将 CI 工具由 Travis 迁移到 GitHub Actions ,配置了独立的 Workflow 进行代码编译、UT,很大程度提高了 PR 的合入效率。

3.2 支持 Docker-Compose 一键部署

InLong 拥有超过 6 个模块,完整的使用 InLong 还依赖 MySQL、Hive、Flink 集群等第三方服务组件,为了方便新用户快速了解 InLong ,直观感受 InLong 的特性支持 Docker-Compose 一键部署,在 0.10.0 版本中,我们将所有组件 Docker 化,借助 Docker-Compose 提供一键安装能力,感兴趣的用户可以参考 InLong Standalone Using Docker Compose 体验。

InLong Standalone Using Docker Compose 地址:

https://github.com/apache/incubator-inlong/blob/master/docker/docker-compose/README.md

3.3 增加 Hive 入库 Example

0.9.0 版本我们只开放了 InLong 入库 Hive 的能力,为了指导大家快速将采集的数据分拣到 Hive ,我们增加 Hive 入库 Example,Step by Step 帮助用户快速开始使用 InLong 。

 

入库 Hive 示例:

https://inlong.apache.org/zh-cn/docs/example.html

3.4 InLong Manger 整合 OpenAPI 和 API

InLong Manager 为 WebSite 提供了统一的访问 API ,为了方便其它模块获取元数据信息提供了统一的 OpenAPI 。在之前的版本中, API 和 OpenAPI 分别有两个独立的项目管理,安装时需要单独配置和启动,使用不同的端口提供服务。在 0.10.0 版本中,我们整合了 OpenAPI 和 API ,使用不同 URL Path 进行区分,通过一个项目来管理两套 API ,实现 Manager 只用部署一次的效果。

3.5 InLong Sort 增加 Pulsar 分拣能力

TubeMQ 的架构在性能和成本上拥有天然的优势,但没有多副本机制,可能会丢数据,而 Apache Pulsar 可以弥补这方面的不足。同时,为了实现 InLong 能够快速复用已有的消息队列服务,我们计划全链路支持 Pulsar ,在 0.10.0 版本中,InLong Sort 优先支持了 Pulsar 数据源的分拣能力,在后续版本中会完善 DataProxy->Pulsar、Manager->Pulsar ,实现 InLong 全链路支持 Apache Pulsar 。当然,我们也希望在未来全链路支持 Kafka 。

3.6 InLong Sort 支持指标系统

InLong Sort 中需要统计各个阶段数据条数的指标数据,如读入数据的条数,解析阶段失败/成功的数据条数,入库条数。指标系统用来统计系统各个阶段的数据条数,为了保证指标和数据语义的一致,我们通过 Flink 的 side output stream 输出指标。同时配合 flink 的窗口机制对指标进行预聚合,保证输出指标的量级不会太大。在 0.10.0 版本中,首先支持了通过日志的方式输出指标(At-least-once),后续我们计划扩展输出指标的系统,如 MySQL ,HBase 等,同时支持输出指标的 Exactly-once 。

3.7 InLong WebSite 国际化

上个版本重点是整合所有 InLong 所有模块,前端国际化没有来得及做,在这个版本一起优化了。InLong 当前还有很多待翻译的文档,计划在后续版本一起完善,期待英语不错的社区爱好者加入翻译大军。

3.8 InLong TubeMQ 优化 Web API

该特性将以往元数据变更后需要外部被动、批量的加载调整为 由 Master 自动的分批加载,并且数据加载与后续的配置变更同步进行。

3.9 InLong Agent 重构 DataProxy 配置获取方式

InLong Agent 采集到数据后,会将数据发送到 DataProxy ,所以 DataProxy 的配置信息需要 Agent 提前拿到。在上个版本的实现中,我们在每个接入任务的 Agent 配置文件中指定 DataProxy 的地址等信息。而在 0.10.0 版本中,我们重构了这部分实现,交由 Manager 管理 DataProxy 地址等信息,Agent 中配置的接入任务直接通过 Manager OpenAPI 获取。

3.10 进一步整合 InLong 各模块

在上个版本,InLong 各个模块编译后的二进制文件分散在不同目录,启停配置、命名、端口使用等也不统一,InLong 给人一种“拼凑”的印象。在 0.10.0 版本中,为了进一步强化 InLong 整体性,我们将各个模块编译结果输出到统一目录,增加 Maven 编译 InLong WebSite ,并规范了目录、脚本等名称,重新整理了安装部署文档,使所有模块更加统一。

Apache InLong(incubating) 后续规划

在 InLong 后续版本规划中,我们会进一步释放 InLong 的能力,覆盖更多的使用场景,主要包括

  • 支持 Apache Pulsar 全链路数据接入能力

  • 支持 ClickHouse、Apache Iceberg、Apache HBase 等数据流向

  • InLong on Kubernetes

 

Apache InLong(incubating) 贡献者招募

Apache InLong(incubating) 目前还处在项目孵化的初期,还有很多工作需要做,包括社区运营、文档翻译、Feature 开发等,期待更多的开源爱好者一起共建。在过去的一个版本,Apache InLong 新增国内外贡献者 6 名,实现快速增长。当前社区重于代码,我们急需更多的贡献者加入快速发展的项目社区,努力将 InLong 打造成 Apache 顶级项目,以下为 InLong 重要发展时间点:

 

  • 2019 年 9 月 12 日,TubeMQ 对外开源并捐献给 Apache 社区

  • 2019 年 11 月 3 日,进入 Apache 社区孵化

  • 2020 年 5 月 30 日,按照 Apache 社区规范发布第一个社区版本

  • 2020 年 12 月 20 日,进行项目改名讨论和投票

  • 2021 年 2 月 11 日,发起社区改名变更申请

  • 2021 年 4 月 11 日,完成社区改名,调整为 Apache InLong

  • 2021 年 7 月 12 日,发起更名后第一个版本 0.9.0 投票

 

Apache InLong 项目官方网站:https://inlong.apache.org/zh-cn/

Apache InLongGitHub 地址:https://github.com/apache/incubator-inlong

 

记得点个关注哟~

原文地址:https://www.cnblogs.com/tencent-opensource/p/15331848.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


可以认为OpenFeign是Feign的增强版,不同的是OpenFeign支持Spring MVC注解。OpenFeign和Feign底层都内置了Ribbon负载均衡组件,在导入OpenFeign依赖后无需专门导入Ribbon依赖,用做客户端负载均衡,去调用注册中心服务。
为进一步规范小程序交易生态、提升用户购物体验、满足用户在有交易的小程序中便捷查看订单信息的诉求,自2022年12月31日起,对于有“选择商品/服务-下单-支付”功能的小程序,需按照平台制定的规范,在小程序内设置订单中心页。开发者可通过小程序代码提审环节,或通过「设置-基础设置-小程序订单中心path设置」模块设置订单中心页path。1、 新注册或有版本迭代需求的小程序,可在提审时通过参数配置该商家小程序的订单中心页path。2、无版本迭代需求的小程序,可在小程序订单中心path设置入口进行设置。
云原生之使用Docker部署Dashdot服务器仪表盘
本文主要描述TensorFlow之回归模型的基本原理
1.漏洞描述Apache Druid 是一个集时间序列数据库、数据仓库和全文检索系统特点于一体的分析性数据平台。Apache Druid对用户指定的HTTP InputSource没有做限制,并且Apache Druid默认管理页面是不需要认证即可访问的,可以通过将文件URL传递给HTTP InputSource来绕过。因此未经授权的远程攻击者可以通过构造恶意参数读取服务器上的任意文件,造成服务器敏感性信息泄露。2.影响版本Apache Druid <= 0.21.13...
内部类(当作类中的一个普通成员变量,只不过此成员变量是class的类型):一个Java文件中可以包含多个class,但是只能有一个public class 如果一个类定义在另一个类的内部,此时可以称之为内部类使用:创建内部类的时候,跟之前的方法不一样,需要在内部类的前面添加外部类来进行修饰 OuterClass.InnerClass innerclass = new OuterClass().new InnerClass();特点:1.内部类可以方便的访问外部类的私有属性...
本文通过解读国密的相关内容与标准,呈现了当下国内技术环境中对于国密功能支持的现状。并从 API 网关 Apache APISIX 的角度,带来有关国密的探索与功能呈现。作者:罗泽轩,Apache APISIX PMC什么是国密顾名思义,国密就是国产化的密码算法。在我们日常开发过程中会接触到各种各样的密码算法,如 RSA、SHA256 等等。为了达到更高的安全等级,许多大公司和国家会制定自己的密码算法。国密就是这样一组由中国国家密码管理局制定的密码算法。在国际形势越发复杂多变的今天,密码算法的国产化
CENTOS环境Apache最新版本httpd-2.4.54编译安装
Apache HTTPD是一款HTTP服务器,它可以通过mod_php来运行PHP网页。影响版本:Apache 2.4.0~2.4.29 存在一个解析漏洞;在解析PHP时,将被按照PHP后缀进行解析,导致绕过一些服务器的安全策略。我们查看一下配置:读取配置文件,前三行的意思是把以 结尾的文件当成 文件执行。问题就在它使用的是 符号匹配的,我们都知道这个符号在正则表达式中的意思是匹配字符串的末尾,是会匹配换行符的,那么漏洞就这样产生了。 进入容器里,打开index.php,发现如果文件后缀名为 php、
apache Hop现在好像用的人很少, 我就自己写一个问题收集的帖子吧, 后面在遇到什么问题都会在该文章上同步更新
2.启动容器ps:注意端口占用,当前部署在 8080 端口上了,确保宿主机端口未被占用,不行就换其他端口ps:用户名和密码都是 admin,一会用于登录,其他随便填5.下载一个官方提供的样例数据库【可跳过】ps:此步国内无法访问,一般下载不了,能下的就下,不能下的跳过就行了,一会配置自己的数据库7.访问登录页面ps:注意端口是上面自己配置的端口,账号密码是 admin依次点击 Settings → Database Connections点击 DATABASE 就可以配置自己的数据库了
String类的常用方法1. String类的两种实例化方式1 . 直接赋值,在堆上分配空间。String str = "hello";2 . 传统方法。通过构造方法实例化String类对象String str1 = new String("Hello");2.采用String类提供的equals方法。public boolean equals(String anotherString):成员方法 str1.equals(anotherString);eg:publi
下载下载地址http://free.safedog.cn下载的setup:安装点击下面的图标开始安装:可能会提示:尝试先打开小皮面板的Apache服务:再安装安全狗:填入服务名:如果服务名乱写的话,会提示“Apache服务名在此机器上查询不到。”我干脆关闭了这个页面,直接继续安装了。安装完成后,需要进行注册一个账户,最后看到这样的界面:查看配置:...
一、问题描述一组生产者进程和一组消费者进程共享一个初始为空、大小n的缓冲区,只有缓冲区没满时,生产者才能把资源放入缓冲区,否则必须等待;只有缓冲区不为空时,消费者才能从中取出资源,否则必须等待。由于缓冲区是临界资源,它只允许一个生产者放入资源,或一个消费者从中取出资源。二、问题分析(1)、关系分析。生产者和消费者对缓冲区互斥访问是互斥关系,同时生产者和消费者又是一个相互协作的关系,只有生产者生产之后,消费者只能才能消费,它们还是同步关系。(2)、整理思路。只有生产生产者和消费者进程,正好是这两个进程
依赖注入的英文名是Dependency Injection,简称DI。事实上这并不是什么新兴的名词,而是软件工程学当中比较古老的概念了。如果要说对于依赖注入最知名的应用,大概就是Java中的Spring框架了。Spring在刚开始其实就是一个用于处理依赖注入的框架,后来才慢慢变成了一个功能更加广泛的综合型框架。我在学生时代学习Spring时产生了和绝大多数开发者一样的疑惑,就是为什么我们要使用依赖注入呢?现在的我或许可以给出更好的答案了,一言以蔽之:解耦。耦合度过高可能会是你的项目中一个比较
<dependency><groupId>org.apache.velocity</groupId><artifactId>velocity-engine-core</artifactId><version>使用人数最多的版本</version></dependency>importorg.apache.velocity.Template;importorg.apache.velo
Java Swing皮肤包前言:一.皮肤包分享二.皮肤包的使用1.先新建一个项目。2.导入皮肤包1.先导入我们刚刚下载的jar文件,右键项目demo即可2.如果右键没有这个选项,记得调为下图模式3.点击下图蓝色圆圈处4.找到刚刚下载的jar文件,点击打开即可5.我们看一下效果,是不是比原生的好看前言:因为Java Swing自身皮肤包不是很好看,甚至有点丑,怎么让你的界面更加好看,这里就需要用到皮肤包,我发现了一个还不错的皮肤包,让你的界面美观了几个等级。废话不多说。一.皮肤包分享百度网盘分享链接:
一、前言在做Java项目开发过程中,涉及到一些数据库服务连接配置、缓存服务器连接配置等,通常情况下我们会将这些不太变动的配置信息存储在以 .properties 结尾的配置文件中。当对应的服务器地址或者账号密码信息有所变动时,我们只需要修改一下配置文件中的信息即可。同时为了让Java程序可以读取 .properties配置文件中的值,Java的JDK中提供了java.util.Properties类可以实现读取配置文件。二、Properties类Properties 类位于 java.util.Pro
Mybatis环境JDK1.8Mysql5.7maven 3.6.1IDEA回顾JDBCMysqlJava基础MavenJunitSSM框架:配置文件的最好的方式:看官网文档Mybatis1、Mybatis简介1.1 什么是Mybatis如何获得Mybatismaven仓库:中文文档:https://mybatis.org/mybatis-3/zh/index.htmlGithub:1.2 持久化数据持久化持久化就是将程序的数据在持久状态和瞬时状态转