
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文整理自网易游戏实时计算&数据湖平台负责人林小铂老师和网易游戏大数据开发工程师陈宇智老师,在Flink Forward Asia 2024 云原生专场的分享。

人工智能是未来十年最重要的技术革命与驱动力,在各行各业产生着日益重要的作用,它与大数据的发展相辅相成,不仅推动人类社会迈入更智慧的世界,也为数据的应用带来无可估量的价值。...
本文介绍OpenAI构建流处理平台的实践与挑战。面对Kafka高可用、Python生态兼容、云环境限制等问题,团队基于PyFlink打造跨区域流处理架构,集成Kafka HA组、自研代理与控制平面,支撑实时Embedding生成、特征计算等场景,并推动开源协作与平台自动化演进。

Flink 2.2.0 引入了一个新的 MaterializedTableEnricher 接口,该接口为自定义的默认逻辑提供了一个正式的扩展方式,允许高级用户实现“智能”的默认行为(例如,从上游表推断数据新鲜度)。在 Flink 2.2.0 版本中,Table API 支持了模型推理操作,允许将机器学习模型直接集成到数据处理中,并使用特定提供商(例如 OpenAI)的模型对数据进行预测处理。是

Apache Flink 一直以来都擅长有状态流处理,但传统流式 Join 在面对海量数据和高基数 Key 时却遇到了瓶颈。它不再将所有数据缓存在内部,而是将 Join 转变为一种无状态的查询机制,直接从 Apache Fluss 或 Apache Paimon 等外部表中实时获取所需数据。虽然 Fluss 是 Delta Join 的初始载体,但 Flink 社区正积极推动其与开源湖仓格式的融合

本文整理自阿里云高级产品解决方案架构师王启华(敖北)老师在 Flink Forward Asia 2023 中闭门会的分享。

本文整理自 Apache Paimon PMC Chair 李劲松(之信)老师在5月16日 Streaming Lakehouse Meetup · Online 上的分享,主要分享 Apache Paimon 相关的演进、目标及应用。

践,覆盖大模型、AIGC、大数据 AI 一体、数据分析计算、数据开发治理、AI 搜索等多领域,期待与您在云栖小镇相聚,一同探索“阿里云智能集团计算平台事业部负责人 汪军华,带来大数据 AI 平台年度发布,解读大数据 AI 平台各款产品的重大功能升级。9月26日上午,在云栖大会开源大数据分论坛上,阿里云开源大数据团队将带来。云上 Flink 能力的最新技术分享。2025云栖大会·大数据AI。议程已定
Apache Flink 是实时数据处理领域的核心技术,历经十年发展,已从学术项目成长为实时计算的事实标准。它在现代数据架构中发挥着关键作用,支持实时数据分析、湖仓集成及实时 AI 应用。随着 Flink 2.0 的发布,其在流式湖仓、AI 驱动决策等方面展现出强大潜力,正推动企业迈向智能化、实时化的新阶段。

Apache Fluss 是一个专为实时分析与 AI 场景打造的流式存储系统,旨在解决传统架构中数据重复复制、成本高昂、延迟高等问题。它基于 Apache Arrow 构建,支持列式存储、KV 查询、湖仓集成与流批统一读取,显著提升机器学习与多模态数据处理效率。Fluss 已在阿里巴巴大规模落地,具备高性能、低成本、易扩展等优势,未来将深度集成多模态 AI 与开放数据生态,助力构建统一的实时数据底








