logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Flink CDC:基于 Apache Flink 的流式数据集成框架

Flink CDC 最早的发展就始于 GitHub 开源社区。自 2020 年 7 月开始,项目在 Ververica 公司的 GitHub 仓库下以 Apache 2.0 协议开放源代码。并提供了从主流 MySQL 和 PG SQL 数据库中捕获变化数据的能力。2.0 版本引入了运行更高效、更稳定、支持故障恢复的增量快照框架,并且丰富了源数据库支持范围,能够从 Oracle、MongoDB 实时

文章图片
#flink#apache#大数据
Flink+StarRocks 实时数据分析新范式

StarRocks 社区技术布道师谢寅,在 Flink Forward Asia 2022 实时湖仓的分享。

文章图片
#flink#数据分析#大数据 +1
腾讯看点基于 Flink 的实时数仓及多维实时数据分析实践

当业务发展到一定规模,实时数据仓库是一个必要的基础服务。从数据驱动方面考虑,多维实时数据分析系统的重要性也不言而喻。但是当数据量巨大的情况下,拿腾讯看点来说,一天上报的数据量达到万亿级的...

#大数据#分布式#编程语言 +1
Paimon 在汽车之家的业务实践

本文分享自汽车之家的王刚、范文、李乾⽼师。介绍了汽车之家基于 Paimon 的一些实践,和一些背景。

文章图片
#汽车
快速实践: 通过 Flink CDC 一键整库同步 MongoDB 到 Paimon

Apache Paimon (incubating) 是一项流式数据湖存储技术,可以为用户提供高吞吐、低延迟的数据摄入、流式订阅以及实时查询能力。

文章图片
#flink#mongodb#大数据 +1
Apache Paimon 在蚂蚁的应用

Paimon 是一种面向流而设计的实时数据湖格式。主要有以下特点:支持高效的实时更新,是基于 LSM Tree 结构,整个流程基于 Append + Compaction 模型。LSM Tree是业界经过很多DB系统采纳的一种存储结构,写入和更新的吞吐可以得到较好保障。Paimon 也支持多种不同的 Changelog Producer,Changelog 类似于数据库里面的Binglog,是流式

文章图片
#flink#大数据
基于 Flink SQL 和 Paimon 构建流式湖仓新方案

摘要:本文整理自阿里云智能开源表存储负责人,Founder of Paimon,Flink PMC 成员李劲松(花名:之信)在云栖大会开源大数据专场的分享。本篇内容主要分为三部分:1.数据分析架构演进2.介绍 Apache Paimon3. Flink + Paimon 流式湖仓Tips:点击「阅读原文」免费领取 5000CU*小时 Flink 云资源01数据分析架构演...

文章图片
#flink#sql#大数据 +1
Flink JDBC Connector:Flink 与数据库集成最佳实践

整理:陈政羽(Flink 社区志愿者)摘要:Flink 1.11 引入了 CDC,在此基础上, JDBC Connector 也发生比较大的变化,本文由Apache Flink Con...

#数据库#java#大数据 +2
重磅揭晓!Flink Forward Asia 2019 议程完整出炉

60 年前,人工智能的诞生刷新了人类对技术的期待;过去 10 年,大数据、云计算等核心技术的发展,推动了整个社会的重构与革新;5 年时间,移动互联网从诞生到逐步实现万物互...

基于 Flink ML 搭建的智能运维算法服务及应用

本文整理自阿里云计算平台算法专家张颖莹,在 Flink Forward Asia 2022 AI 特征工程专场的分享。

文章图片
#运维#flink#大数据 +1
    共 35 条
  • 1
  • 2
  • 3
  • 4
  • 请选择