FlinX - 程序员宅基地

数据集成框架FlinkX（纯钧）入门

FlinkX数据集成框架入门

FlinkX启动流程分析

base FlinkX源码1.12_release版本 ...启动脚本：flinx/bin/flinkx A.提交过程：入口类：com.dtstack.flinkx.client.Launcher 从main方法开始： 1.通过OptionParser类解析校验启动时传入的参数 Opt

flinkx测试环境搭建

标签： flink 大数据

1，下载flink的压缩包(根据flinkx的版本下载flinx) 2，解压文件 3，配置文件配置在flink的安装目录下的conf下修改master、slaves、flink-conf.yaml三个文件注:windows环境安装flink的相关问题 ##需要在flink-conf...

FlinkX快速开始

标签：数据库

FlinkX是一个基于Flink的批流统一的数据同步工具，既可以采集静态的数据，比如MySQL，HDFS等，也可以采集实时变化的数据，比如MySQL binlog，Kafka等。

数栈技术分享：详解FlinkX中的断点续传和实时采集

数栈是云原生—站式数据中台PaaS，我们在github和gitee上有一个有趣的开源项目：FlinkX，FlinkX是一个基于Flink的批流统一的数据同步工具，既可以采集静态的数据，也可以采集实时变化的数据，是全域、异构、批流一体...

Flink: checkPoint

标签： Flink

依据1.17.1 最新版本的内容研究下期运作原理,总的来说其实就是设置一些参数,这些参数就会影响到如何存储checkpoint的问题.用起来没什么难的,参数配置的组合到是挺多[email protected]。

[数据存储]HDFS的简介、初始化配置与运行

标签： hdfs hadoop 大数据

HDFS（Hadoop Distributed File System）Hadoop分布式文件系统，是Hadoop项目中关于数据存储的组件，是Hadoop项目的一部分。

数据同步工具chunjun(flinkx)-1.12.7 使用tips

标签： json 大数据数据库

记录分享关于chunjun与官网描述不符的点，或是使用过程中遇到过的问题，便于快速上手

基于flink 的LakeHouse 2.0湖仓一体架构

标签： flink 架构数据仓库

Lakehouse 是一种结合了数据湖和数据仓库优势的新范式，解决了数据湖的局限性。Lakehouse 使用新的系统设计：直接在用于数据湖的低成本存储上实现与数据仓库中类似的数据结构和数据管理功能。如果你现在需要重新设计...

Hive常见属性配置

标签： hive hadoop 大数据

Hive常见属性

flink-checkpoint 功能验证与排错

flink-checkpoint 验证1、正在运行的任务，增加source表字段2、正在运行的任务，删除source表字段3、从checkpoint 点恢复，逻辑不能做任务修改 1、正在运行的任务，增加source表字段不影响原始任务运行 ...

Flink的CheckPoint机制

标签： java

这里已经是Flink的第三篇原创啦。第一篇：Flink入门讲解了Flink的基础和相关概念，第二篇：压背原理，讲解了什么是背压，在Flink背压大概的流程是怎么样的。这篇来讲Flink另一个比较重要的知识，就是它的容错机制...

Flink 检查点启用与配置

标签： flink 大数据 big data

Flink版本：1.11 Flink 中每个函数和算子都可以是有状态的。有状态函数在处理单个元素/事件时会存储数据。为了能够使状态可以容错，Flink 需要对状态进行 checkpoint。checkpoint 可以允许 Flink 在流中恢复状态...

Flink Checkpoint机制

标签： flink

来源Flink官网

数仓之flink数据采集

标签： flink 数据仓库同步

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、...

Flinkx Mysql同步数据到Hive 实例

标签：大数据 flink

提前安装好hadoop，Hive和mysql。 1. 开启hadoop和hive [root@slave13 conf]# start-all.sh [root@slave13 conf]# hive [root@slave13 conf]# hiveserver2 ...[root@slave13 conf]# xcall jps ...

Flink-CDC和其他的CDC比较

标签： flink 其他 kafka

什么是 CDC? CDC 是 Change Data Capture(变更数据获取)的简称。核心思想是，监测并捕获数据库的变动（包括数据或数据表的插入、更新以及删除等），将这些变更按发生的顺序完整记录下来，写入到消息中间件中以供其他...

linux DB2 文件乱码,db2乱码的问题

标签： linux DB2 文件乱码

在unix或者linux中，db2导入数据中的汉字经常是乱码，主要有两个方面的原因： 1.导入数据前，数据就是乱码，系统无法识别 2.db2的编码不是汉字编码解决方法： 1.locale查看系统编码，一般系统支持汉字的编码有...导...

几种不同的ETL工具简单理解

标签： etl

个人从开始了解ETL到现在，接触最多的还是sqoop，感觉sqoop更多见一点。也不清楚为什么那么多公司要求kettle\informatic等等。下面谈一下个人对这些工具的理解，及应用场景 sqoop：个人感觉，大数据开发的同事...

Flink的数据持久化-CheckPoint机制

Flink内存易失，利用CheckPoint机制数据持久化，偏于出现异常，应用挂掉时，做数据恢复。所谓CheckPoint（可以理解为CheckPoint是把State数据持久化存储了）则表示了一个FlinkJob在一个特定时刻的一份全局状态快照，...

Flink Sql教程（2）

标签： flink

从kafka到mysql 新建Java项目最简单的方式是按照官网的方法，命令行执行curl https://flink.apache.org/q/quickstart.sh | bash -s ...注意的是，本地测试的时候，记得将scope注掉，不然会出现少包的情况。也可...

flinkX快速启动

标签： flink

在flinkx启动之前，请提前安装git，maven，mysql(已同步mysql为例)。 windows安装提前安装好jdk和maven 下载代码 1.使用git工具把项目clone到本地，或者直接下载flinkx-1.8.5.zip ... 2.直接下载源码 ...

Flink 1.9.1 安装及启动

标签： flink集群安装和启动

这里部署环境为CDH6.2 集群，三个节点，Flink 版本为编译的 Flink1.9.1 版本。 Flink集群有两种部署的模式，分别是 Standalone 以及 YARNCluster 模式。Standalone 模式，Flink 必须依赖于 ZooKeeper 来实现 ...

Hive2 Hive命令

标签： java 大数据 hive

Hive2 Hive命令 Hive常用命令查看hive命令的一个简明说明 hive --help 需要注意 Service List 后面的内容。这里提供了几个服务，包括我们绝大多数时间将要使用的CLI。用户可以通过 --service name 服务名称来启用...

Flinkx

标签： Flinkx

架构基于flink的分布式离线和实时的数据同步框架，实现了多种异构数据源之间高效的数据迁移。不同的数据源头被抽象成不同的Reader插件（Source），不同的数据目标被抽象成不同的Writer插件（Sink）。...

Flex中JSON使用的一些总结

标签： json Flex JavaScript

JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,它采用完全独立于语言的文本格式,可以用来在客户端和服务器端传输数据！JSON对象既可用于AJAX的开发中，也可用一般的J2EE的开发中，用于一次性...

Oracle数据实时同步大数据平台的解决方案

标签：大数据

Oracle数据实时同步大数据平台的解决方案摘要:基于传统企业Oracle数据库实时增量数据同步到Kafka消息系统，供下游做实时分析/实时ETL等场景，引进Oracle GoldenGate组件提供不影响系统处理功能的实时数据集成和...

FlinkX流控实现

标签： FlinkX 累加器 Flink

FlinkX流控实现流量控制防止并发性能过高对源数据库造成影响。在FlinkX中，流量控制是采用Byte为单位/s进行流量控制的。配置参数实例： { “speed”: { "bytes": 0 } ...整个计算的速率是根据整个系统中的指标，...

FlinkX的数据类型

标签： java flink flinkX

FlinkX的数据类型从上一章节里面看到： DataStream<Row> dataStream = dataReader.readData(); 这个简单的代码里面我们可以得出每一行数据都转化为了Row对象数据转化为了数据流 ...我们下面看一下Row是如何...

Flinkx/Datax/Flink-CDC 优劣势对比

标签： flink

一、FlinkX简介 FlinkX是一个基于Flink的批流统一的数据同步工具，既可以采集静态的数据，比如MySQL，HDFS等，也可以采集实时变化的数据，比如MySQL binlog，Kafka等。FlinkX目前包含下面这些特性： ...

”FlinX“ 的搜索结果

数据集成框架FlinkX（纯钧）入门

FlinkX启动流程分析

flinkx测试环境搭建

FlinkX快速开始

数栈技术分享：详解FlinkX中的断点续传和实时采集

Flink: checkPoint

[数据存储]HDFS的简介、初始化配置与运行

数据同步工具chunjun(flinkx)-1.12.7 使用tips

基于flink 的LakeHouse 2.0湖仓一体架构

Hive常见属性配置

flink-checkpoint 功能验证与排错

Flink的CheckPoint机制

Flink 检查点启用与配置

Flink Checkpoint机制

数仓之flink数据采集

Flinkx Mysql同步数据到Hive 实例

Flink-CDC和其他的CDC比较

linux DB2 文件乱码,db2乱码的问题

几种不同的ETL工具简单理解

Flink的数据持久化-CheckPoint机制

Flink Sql教程（2）

flinkX快速启动

Flink 1.9.1 安装及启动

Hive2 Hive命令

Flinkx

Flex中JSON使用的一些总结

Oracle数据实时同步大数据平台的解决方案

FlinkX流控实现

FlinkX的数据类型

Flinkx/Datax/Flink-CDC 优劣势对比

推荐文章