Flink专栏_大数据技术专区

Flink

分布式流处理引擎，可用于实时数据流处理、批处理和图形处理

16篇内容

Flink流批一体计算（9）：Flink Python

如果您的Flink Python作业中使用了Java类，例如作业中使用了Connector或者Java自定义函数时，则需要指定Connector或者Java自定义函数所在的JAR包。为了使用该Python虚拟环境，您可以选择将该Python虚拟环境分发到集群的所有节点上，也可以在提交PyFlink作业的时候，指定使用该Python虚拟环境。执行 PyFlink job，增加 source和资源文件

1313 

victory0508 · 2023-06-29 11:14:17

Flink中时间和窗口

如图所示，在事件发生之后，生成的数据被收集起来，首先进入分布式消息队列，然后被 Flink 系统中的 Source 算子读取消费，进而向下游的转换算子（窗口算子）传递，最终由窗口算子进行计算处理。有两个非常重要的时间点：一个是数据产生的时间，我们把它叫作“事件时间”（Event Time）；另一个是数据真正被处理的时刻，叫作“处理时间”（Processing Time）。我们所定义的窗口操作，到

1w 

ha_lydms · 2023-06-28 22:28:52

Flink简介与集群的简单部署

Apache Flink是一个框架和分布式处理引擎，用于对无界和有界数据流进行状态计算Flink框架处理流程Flink的应用场景。

1059 

1 

PanpanMn · 2023-05-29 16:48:56

深入解读 Flink 1.17

摘要：本文整理自阿里云技术专家，Apache Flink PMC Member & Committer、Flink CDC Maintainer 徐榜江(雪尽) 在深入解读 Flink 1.17 Meetup 的分享。

1422 

Apache Flink · 2023-05-24 20:01:41

使用 Apache Flink 开发实时 ETL

Apache Flink 是大数据领域又一新兴框架。它与 Spark 的不同之处在于，它是使用流式处理来模拟批量处理的，因此能够提供亚秒级的、符合 Exactly-once 语义的实时处理能力。Flink 的使用场景之一是构建实时的数据通道，在不同的存储之间搬运和转换数据。本文将介绍如何使用 Flink 开发实时 ETL 程序，并介绍 Flink 是如何保证其 Exactly-once 语义的。

2241 

mylife512 · 2023-05-19 18:27:41

Flink读写Doris操作介绍

Flink Doris Connector 可以支持通过 Flink 操作（读取、插入、修改、删除） Doris 中存储的数据。可以将 Doris 表映射为 DataStream 或者 Table。

1w 

9 

王亭_666 · 2023-05-15 10:55:17

Apache Flink X Apache Doris构建极速易用的实时数仓架构

Doris针对不同的应用场景提供了不同的数据模型，分别为：明细模型，主键模型和聚合模型。明细模型：明细数据存储（日志分析、行为分析）主键模型：相同key的数据覆盖更新（订单状态、用户状态）聚合模型：相同key列value列合并（报表统计、指标计算）

4612 

wangleigiser · 2023-02-14 15:52:35

大数据组件之Flink

Flink是一个框架和分布式处理引擎，用于在无界和有界数据流上进行有状态计算。Flink被设计为在所有常见的集群环境中运行，以内存速度和任何规模执行计算。

12.4w 

识时务者-HJJ · 2022-12-19 09:20:51

Flink在Yarn模式部署和命令

flink的yarn提交模式

3499 

weixin_lss · 2022-10-25 11:26:33

Flink调优法则

3013 

锋火连天 · 2022-04-17 17:13:12