手机版
热门标签
站点地图
我要投稿
广告合作
联系我们
搜 索
广告位招租
广告位招租
切换导航
首页
编程教程
编程导航
编程百科
编程博文
编程实例
常见问题
产品运营
软件教程
办公软件
栏目导航
▸ 算法
▸ 设计模式
▸ 多媒体技术
▸ 正则表达式
▸ Elasticsearch
▸ Flink
▸ Hadoop
▸ IDE
▸ UML
▸ Promise
▸ Gis
公众号推荐
微信公众号搜
"智元新知"
关注
微信扫一扫可直接关注哦!
编程之家
Flink
数据湖简介
数据湖是将公司所有数据,外部数据,不知道要不要用的数据放在一起,通过一定的数据治理,让数据可以被发现,被理解,以用于交叉查询或机器学习的研究。数据湖不麻烦,管理数据湖中的数据最麻烦,一不小心就会变成数据沼泽。没人知道里面有什么数据,从哪来的,是干嘛的。目前市面上流行的三大开
Flink计算PV,UV的案例及问题分析
Flink计算PV,UV的案例及问题分析浪院长浪尖聊大数据PV(访问量):即PageView,即页面浏览量或点击量,用户每次刷新即被计算一次。UV(独立访客):即UniqueVisitor,访问您网站的一台电脑客户端为一个访客。00:00-24:00内相同的客户端只被计算一次。一个UV可以用很多PV,一个PV也只能
Flink状态管理之状态清除StateTtlConfig
1、Flink状态去重场景在Flink运行的时候,往往是无休止的运行,在整个Flink程序运行的长河中,往往会出现很多状态的出现,那么状态的生命周期,也就是创建、使用和销毁,那么在我们写flink程序过程中,往往不需要关注flink状态的清理,flink内部就会对我们的状态进行清理,例如我们开一个10分钟
FlinkSQL演进过程,解析原理及一些优化策略
FlinkSQL演进过程,解析原理及一些优化策略云邪浪尖聊大数据本文整理自FlinkForward全球在线会议,演讲者云邪,由浪尖整理。1.Flinktable/sql架构演变flink1.9之前的版本,对于TableAPI和SQL的底层实现结构如下图,可以看处流处理和批处理有各自独立的api(流处理DataStream,批
关于Flink的批处理和流处理的 Table & SQL API详解
1-TableAPI&SQL之入门案例以案例形式,讲解TableAPI和SQL基本使用,分别针对批处理和流计算使用TableAPI和SQL分析数据。首先看一下FlinkTableAPI和SQL使用,构建应用步骤。第一步、添加依赖第2步、具体提供API目前新版本(当前使用版本Flink1.10)Flink的Table和S
Apache Flink 如何正确处理实时计算场景中的乱序数据
一、流式计算的未来在谷歌发表了GFS、BigTable、GoogleMapReduce三篇论文后,大数据技术真正有了第一次飞跃,Hadoop生态系统逐渐发展起来。Hadoop在处理大批量数据时表现非常好,主要有以下特点:计算开始之前,数据必须提前准备好,然后才可以开始计算;当大量数据计算完成之后,会
Flink的时间语义和watermark
时间(Time)语义EventTime:事件创建的时间IngestionTime:数据进入Flink的时间ProcessingTime:执行操作算子的本地系统时间,与机器相关在代码中设置EventTime我们可以直接在代码中,对执行环境调用setStreamTimeCharacteristic方法,设置流的时间特性具体的时间,还需要从数据
blink解决的一个flink分析痛点
blink解决的一个flink分析痛点浪院长浪尖聊大数据blink正在紧锣密鼓的与flink合并,作为flink开发者,大数据开发者,还是有必要测试一下的,经常有粉丝微信群里问浪尖会不会用blink,关于这点,我发过文章了:浪尖你怎么看blink开源?我的建议是等合并之后,测试稳定了再用。那么今天也主要
Flink生产---15Redis、JedisUtil
Flink项目中访问Redis的方法都是自己进行的实现,推荐使用Bahir连接器。在本地单机情况下:publicstaticclassRedisExampleMapperimplementsRedisMapper<Tuple2<String,String>>{@OverridepublicRedisCommandDescriptiongetCommandDescription(){
pyflink sql udaf 使用流程
当Flink提供的内置函数无法满足你的业务处理需要时,此时就可以考虑使用用户自定义函数(UDF(UDF:userdefinedfunction)、(UDAF)、(UDTF)自定义函数类别UDF:自定义标量函数(UserDefinedScalarFunction)。一行输入一行输出。UDAF:自定义聚合函数。多行输入一行输出。UDTF:
案例说明flink的udf
案例说明flink的udf浪尖浪尖聊大数据本文会主要讲三种udf:ScalarFunctionTableFunctionAggregateFunction用户自定义函数是非常重要的一个特征,因为他极大地扩展了查询的表达能力。本文除了介绍这三种udf之外,最后会介绍一个redis作为交互数据源的udf案例。注册用户自定义
微博基于Flink的机器学习实践
分享嘉宾:于茜微博 高级算法工程师编辑整理:王洪达内容来源:FlinkForward导读:微博作为国内比较主流的社交媒体平台,目前拥有2.22亿日活用户和5.16亿月活用户。如何为用户实时推荐优质内容,背后离不开微博的大规模机器学习平台。本文由微博机器学习研发中心高级算法工程师于茜老师分享
Flink01---什么是Flink
特别说明,本博主Flink文章部分内容来自于尚硅谷的Flink系列视频,在此感谢BILIBILI学习平台和尚硅谷官方。1.Flink官网地址http://flink.apache.org2.Flink简介ApacheFlink是一个框架和分布式处理引擎(用于数据计算而非存储框架),用于对无界和有界数据流(流数据,数据是源源不断
你不了解的flink特性-trigger
你不了解的flink特性-trigger浪尖浪尖聊大数据今天主要是聊一下flink的窗口计算的一个小功能-trigger。窗口这个概念还是比较好理解的,就是在某一个纬度(时间,条数等)上选取一段范围,这个范围就是窗口,然后我们后面的计算针对这个窗口进行。今天的例子主要是针对时间窗口进行讲解。
Apache Flink OLAP引擎性能优化及应用
分享嘉宾:贺小令 阿里巴巴技术专家编辑整理:王吉东内容来源:FlinkForwardASIA出品平台:DataFun注:转载请在公众号后台回复“转载”。导读:本次分享的主题为ApacheFlink新场景——OLAP引擎,主要内容包括:背景介绍ApacheFlinkOLAP引擎案例介绍未来计划1.OLAP及其分类OLAP是一种让用户
Flink DataStream编程指南及使用注意事项
FlinkDataStream编程指南及使用注意事项。 浪尖 浪尖聊大数据Flink中的DataStream程序是对数据流进行转换的常规程序(例如,过滤,更新状态,定义窗口,聚合)。数据流的最初的源可以从各种来源(例如,消息队列,套接字流,文件)创建,并通过sink返回结果,例如可以将数据写入文件或标准输出。Flink程
上一页
28
29
30
31
32
33
34
35
下一页
小编推荐
• 一次彻底讲清如何处理mysql 的死锁问题
• MySQL 通过 Next-Key Locking 技术(行
• 一文彻底弄懂mysql的事务日志,undo lo
• Linux系统控制文件 /etc/sysctl.conf详
• linux命令useradd添加用户详解
• vi 和vim 的区别
• Linux系统下如何监测磁盘的使用空间
• linux中查看和开放端口
• Linux设置开放一个端口
• linux之ftp命令详解
• linux系统下实时监控进程以及定位杀死挂
• Linux下安装jdk8的方法
• 阿里云被挖矿进程wnTKYg入侵的解决方法
• 莫小安 CentOS7使用firewalld打开关闭防
• Linux中more和less命令用法
• linux系统里/opt目录和/usr/local目录的
• 如何使用Siege进行压测?
• 本地访问服务器的nacos地址
热门标签
Nvdia
显卡驱动
录屏功能
录制游戏