flink实战 - 程序员宅基地

Flink实战（八十）：flink-sql使用（七）Flink SQL Clien读取Kafka数据流式写入Hive（用hive 管理kafka元...

Flink 1.11.2 Kafka 2.4.0 Hive3.1.2 Hadoop 3.1.3 1 hive 安装hive，使用mysql做为元数据存储 1.2 hive-site.xml 配置（版本3.1.2） <?xml version="1.0"?> <?xml-stylesheet type="text/xsl...

Flink实战（七十四）：flink-sql使用（二）简介（二）入门

标签： sql flink scala

声明：本系列博客是根据SGG的视频整理而成，非常适合大家入门学习。《2021年最新版大数据面试题全面开启更新》 ...SQL 客户端的目的是提供一种简单的方式来编写、调试和提交表程序到 Flink 集群上，.

Flink实战 —— 读取Kafka数据并与MySQL数据关联【附源码】

标签：大数据 Flink

需要导入mysql驱动 <dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> <version>5.1.44</version> <...D

Flink实战案例（五十一）: flink 作业提交（一）提交全流程

标签： flink java 大数据

我们知道 Flink 总共有两种提交模式：本地模式和远程模式( 当然也对应着不同的 environment)，我们以本地模式为主，两种模式基本上相似。当我们执行 env.execute ，实际上调用了 LocalStreamEnvironment.execute ...

Flink实战（113）：flink-sql使用（二十一）Flink SQL FileSystem Connector分区提交与自定义小文件合并...

标签： flink sql big data

之前笔者在介绍Flink 1.11 Hive Streaming新特性时提到过，Flink SQL的FileSystem Connector为了与Flink-Hive集成的大环境适配，做了很多改进，而其中最为明显的就是分区提交（partition commit）机制。本文先通过...

Flink实战-实时读取日志文件和kafka，持续统计TOP10热门商品

标签：大数据 python java

从日志中读取数据做一些统计聚合，最终把想要的数据输出，基本是每个公司都会有的场景，比如用户分析，商品分析，实时大屏等等，我们最早的做法是全部读出来，写到redis或者es去，然后web端再去实时查询统计，其实有...

Flink实战(六) - Table API & SQL编程

标签： Flink Java Scala

Flink提供三层API。每个API在简洁性和表达性之间提供不同的权衡，并针对不同的用例。而且Flink提供不同级别的抽象来开发流/批处理应用程序最低级抽象只提供有状态流。它通过Process Function嵌入到DataStream...

Flink实战（七十八）：flink-sql使用（六）Flink 与 hive 结合使用（一）配置

标签： hive flink sql

声明：本系列博客是根据SGG的视频整理而成，非常适合大家入门学习。《2021年最新版大数据面试题全面开启更新》 1 hive 安装hive，使用mysql做为元数据存储 1.2 hive-site.xml 配置（版本3.1.2） ...

flink实战--flink面试题大全

标签： flink flink面试 flink面试题

第一部分：Flink 中的核心概念和基础考察一、简单介绍一下 Flink Flink 是一个框架和分布式处理引擎，用于对无界和有界数据流进行有状态计算。并且 Flink 提供了数据分布、容错机制以及资源管理等核心功能。 ...

【Flink实战系列】自定义通用的 flatmap 实现数据预聚合功能(keyby + countWindow)

标签： flink

需求有时候我们需要对数据做预聚合操作,比如下游需要批量写入或者批量请求访问的时候,关于预聚合大概有两种解决方案,一种是使用 keyby + countWindow 的方式,第二种就是今天要介绍的 flatmap 的方式....

Flink 实战问题（五）：The transaction timeout is larger than the maximum value allowed by the broker

标签： kafka java big data

设置kafka producer为Semantic.EXACTLY_ONCE会报Unexpected error in InitProducerIdResponse; The transaction timeout is larger than the maximum value allowed by the broker (as configured by max....

Flink实战一 Apache Flink的简介

标签： Flink 大数据 Flink简介

1.Flink是什么？ Apache Flink 是一个框架和分布式处理引擎，用于在无界和有界数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行，并能以内存速度和任意规模进行计算。 2.Flink的特点 Apache ...

【Flink实战】三、分享规则（关联分析）引擎的学习资料

规则引擎或者复杂关联分析引擎的学习资料和参考内容，干货满满，一定要收藏起来！

Flink实战之入库任务调优

在调试flink写hdfs和hive时，任务总是报各种各样的异常，其中255问题最多，异常信息如下： java.lang.Exception: Exception from container-launch. Container id: container_1597847003686_5818_01_000002 Exit ...

flink实战二 -用户行为分析二

标签： flink

用户行为分析二1.实时统计热门商品2.实时统计热门页面3.实时统计PV/UV/GMV4....1.实时统计热门商品需求:每隔5分钟统计最近1个小时热门商品实现思路: 1.读取数据 2.添加水位线，防止乱序。...5.统计窗口数据:每个商品在...

史上最全最详细的flink 中文教程(一千多页pdf).pdf

标签： flink 大数据分布式框架文档

最全最详细的flink 中文教程,详细介绍各个接口,并附带demo(一千多页pdf) 最全最详细的flink 中文教程,详细介绍各个接口,并附带demo(一千多页pdf)

Flink实战（102）：配置（一）管理配置

标签： flink java 大数据

如果你了解 Apache Flink 的话，那么你应该熟悉该如何向 Flink 发送数据或者如何从 Flink 获取数据。但是在某些情况下，我们需要将配置数据发送到 Flink 集群并从中接收一些额外的数据。在本文的第一部分中，我将...

flink实战--延迟监控 metrics.latency.interval

标签： flink big data html5

背景流处理系统进行数据计算时，数据延迟是不可接受的，但是又不可避免的。因此延迟监控在流处理框架中ji'wei

Flink实战之写Hive性能问题

我使用的是Flink1.11.1版本，这个版本有个性能上的问题，见FLINK-19121。该问题已经在1.11.3版本中修复，在HiveTableSink中沿用了FileSystemTableSink的TableRollingPolicy，再该policy中每条数据都会调用 @...

【Flink实战系列】Flink 各种报错汇总以及解决方案(持续更新中)

标签： flink

这篇文章主要用来记录平时使用 Flink 过程中遇到的问题以及解决方案,其实前面已经有一篇这样的文章了,但是那篇文章里面的问题已经很多了,不太方便浏览,所以新开了一篇文章,后面的问题都会更新到这篇文章中. ...

【Flink实战系列】Flink如何提交任务到远程的集群

标签： Flink

Flink可以直接从本地提交任务到远程的集群,这样就不用每次打包上传到集群然后再启动任务,会减少很多时间,下面就来看看具体是怎么实现的? spark在本地提交到远程的yarn集群上可以看这篇文章...

【Flink实战】电商行为数据分析

标签： flink 数据分析 java

一、参考资料 1. 电商行为数据分析尚硅谷Java版Flink（武老师清华硕士，原IBM-CDL负责人）_哔哩哔哩_bilibili

【Flink实战系列】Flink异步IO访问mysql和redis

标签： flink

流计算系统中经常需要与外部系统进行交互，...这是一种同步访问的模式，为了提高性能阿里向Flink提交了异步IO访问第三方存储的方式，大幅度的提升了程序的性能。这个问题其实是上次遗留的问题,当时是写了scala的...

全网第一个 Flink 专栏—— Flink 实战与性能优化

基于 Flink 1.9 讲解的专栏，涉及入门、概念、原理、实战、性能调优、系统案例的讲解。专栏介绍扫码下面图片二维码可以查看&订阅该专栏本文地址：...

Flink实战之FileSystem-parquet支持ZSTD压缩

==

Flink实战（八十七）：flink-sql使用（十四）Flink 与 hive 结合使用（六）Hive 函数

标签： hive flink sql

声明：本系列博客是根据...在 Flink SQL 和 Table API 中，可以通过系统内置的HiveModule来使用 Hive 内置函数，详细信息，请参考HiveModule。 val name = "myhive" val version = "2.3.4" tableEnv.loadModue(...

Flink实战（八）Flink 使用 Kafka Source & Kafka Sink

标签： kafka flink

Flink Kafka Consumer与Flink的检查点机制集成在一起，以提供有且仅有一次的语义。为此，Flink不仅仅依赖于Kafka的消费者群体偏移量跟踪，还内部跟踪和检查这些偏移量。开发流程接一下以一个示例配置来介...

Flink实战教程-自定义函数之TableFunction

标签：大数据 flink 函数

今天我们来聊聊flink sql中另外一种自定义函数-TableFuntion. TableFuntion 可以有0个、一个、多个输入参数，他的返回值可以是任意行，每行可以有多列数据. 实现自定义TableFunction需要继承TableFunction类，然后...

Flink实战三 Flink的安装与部署及使用

标签： Flink安装与部署 Flink高可用配置 Flink HA

安装Flink1.9 1、准备：jdk 1.8 SSH免密登录三台以上机器（我准备了五台）：centos7-1、centos7-2、centos7-3、centos7-4、centos7-5 zookeeper:centos7-3、centos7-4、centos7-5 ... 2、从官网下载flink...

P7级Flink大数据精华实战从Flink大规模集群部署到Flink性能优化 Flink超级实战课程

标签： big data flink 性能优化文档资料大数据

P7级Flink大数据精华实战课程分为四个部分依次进阶的进行教学，从初识Flink及计算框架教学，到全面的FlinkOnYarn集群提交与部署，随后转而深入的进行Flink常用API教学。在后半程的课程中，讲师又对Flink中的...

”flink实战“ 的搜索结果

Flink实战（八十）：flink-sql使用（七）Flink SQL Clien读取Kafka数据流式写入Hive（用hive 管理kafka元...

Flink实战（七十四）：flink-sql使用（二）简介（二）入门

Flink实战 —— 读取Kafka数据并与MySQL数据关联【附源码】

Flink实战案例（五十一）: flink 作业提交（一）提交全流程

Flink实战（113）：flink-sql使用（二十一）Flink SQL FileSystem Connector分区提交与自定义小文件合并...

Flink实战-实时读取日志文件和kafka，持续统计TOP10热门商品

Flink实战(六) - Table API & SQL编程

Flink实战（七十八）：flink-sql使用（六）Flink 与 hive 结合使用（一）配置

flink实战--flink面试题大全

【Flink实战系列】自定义通用的 flatmap 实现数据预聚合功能(keyby + countWindow)

Flink 实战问题（五）：The transaction timeout is larger than the maximum value allowed by the broker

Flink实战一 Apache Flink的简介

【Flink实战】三、分享规则（关联分析）引擎的学习资料

Flink实战之入库任务调优

flink实战二 -用户行为分析二

史上最全最详细的flink 中文教程(一千多页pdf).pdf

Flink实战（102）：配置（一）管理配置

flink实战--延迟监控 metrics.latency.interval

Flink实战之写Hive性能问题

【Flink实战系列】Flink 各种报错汇总以及解决方案(持续更新中)

【Flink实战系列】Flink如何提交任务到远程的集群

【Flink实战】电商行为数据分析

【Flink实战系列】Flink异步IO访问mysql和redis

全网第一个 Flink 专栏—— Flink 实战与性能优化

Flink实战之FileSystem-parquet支持ZSTD压缩

Flink实战（八十七）：flink-sql使用（十四）Flink 与 hive 结合使用（六）Hive 函数

Flink实战（八）Flink 使用 Kafka Source & Kafka Sink

Flink实战教程-自定义函数之TableFunction

Flink实战三 Flink的安装与部署及使用

P7级Flink大数据精华实战从Flink大规模集群部署到Flink性能优化 Flink超级实战课程

推荐文章