logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从 SQL 到自然语言,下一代 Lakehouse 为何必须「AI 优先」

下一代 AI-first Lakehouse 的构建是一个系统性工程,需要从数据处理、存储引擎、计算架构、Agent 支持以及平台生态进行全方位升级。核心目标是打破结构化与非结构化数据的壁垒,将 AI 能力从应用层下沉至内核层,构建真正面向 AI 时代的新一代数据平台。

文章图片
#sql#人工智能#数据库
StarRocks I/O 模型揭秘(一):查询是如何被拆解与调度的?

从整体视角来看,StarRocks 的 I/O 执行链路通过 Morsel、Scan Operator、ChunkSource、ScanTask 与 ChunkBuffer 等组件的协同配合,构建了一套从数据调度、任务拆分到异步执行与结果消费的完整闭环。数据被以更细粒度拆分为可调度单元,通过动态队列实现负载均衡;扫描任务以异步方式下沉到 IO 线程池执行;读取结果再通过缓冲机制与计算链路解耦,从而

文章图片
从 Snowflake 到 StarRocks + Iceberg:Fanatics 在 6PB 规模下实现 90% 成本优化!

开源无国界。在本期「StarRocks 全球用户精选案例」中,我们走进全球领先的数字化体育平台——Fanatics。作为各大体育联盟(如 NFL、NBA、MLB)的官方合作伙伴,Fanatics 运营着 900 多家在线商店,服务全球超 1 亿用户。在这些业务背后,Fanatics 每天需要处理约 10 亿条事件数据,涵盖 800 多种事件类型。从个性化推荐到实时库存决策,高效的数据处理能力已成为

文章图片
#大数据
直播预约|Flink + StarRocks 实时数据分析新范式

11月 26-27 日,Apache Flink (以下简称 Flink)社区官方技术大会 Flink Forward Asia 2022 将在线举行,聚集国内外一线厂商围绕 Flink 生态的生产实践经验进行分享。

文章图片
#flink#数据分析#数据库
速报|StarRocks亮相云栖大会,携手阿里云EMR 打造极速数据湖分析新体验

11 月 3-5 日,2022 云栖大会将在杭州云栖小镇开幕。届时 StarRocks 将有工作人员在D2开发者展位恭候各位,欢迎各位开发者们前去交流。

文章图片
#阿里云#hive#大数据 +1
StarRocks + Paimon: 构建 Lakehouse Native 数据引擎

StarRocks 与 Paimon 的深度融合,代表了现代湖仓架构的重要演进方向。它不只是“能查数据湖”,而是真正“懂数据湖”——从架构统一、功能完善到性能极致优化,每一步都围绕真实业务场景展开。这套 Lakehouse Native 方案已在阿里集团内部多个高并发、低延迟场景中落地验证,为电商、物流、金融等业务提供坚实支撑。随着社区生态的持续壮大,我们有理由相信,StarRocks + Pai

文章图片
#数据库
不止于极速查询!StarRocks 2025 年度回顾:深耕 Lakehouse,加速 AI 融合

2025 年,是 StarRocks 持续深耕与进化的一年。围绕 Lakehouse 与 AI 实时能力,多个关键能力在迭代与实践中渐次落地。项目的每一步前行,都得益于社区每一次真实的反馈与贡献。站在岁末年初,我们希望通过这篇文章,与大家共同回顾 2025 的重要时刻,并分享关于 2026 的规划与期待。

文章图片
#人工智能
双 11 大促峰值不翻车:淘天集团 Paimon + StarRocks 大规模 OLAP 查询实战与优化

作者:朱奥 /淘天集团高级数据工程师导读:双 11 等大促场景会在短时间内集中爆发:运营与业务 BI 在开卖后的窗口期密集访问数据产品,瞬时请求量陡增,对查询引擎的稳定性、成本与治理体系提出极高要求。与此同时,业务对近实时数据产品的诉求持续增强,传统“多存储、多链路、依赖回刷”的模式在研发效率、回刷成本与响应速度上逐步暴露瓶颈。

文章图片
#数据库
一套底座支撑多场景:高德地图基于 Paimon + StarRocks 轨迹服务实践

Paimon + StarRocks 分层存储与高性能查询落地,兼顾实时、性能与成本

文章图片
#数据库#人工智能#数据仓库
StarRocks+Paimon 落地阿里日志采集:万亿级实时数据秒级查询

A+ 流量分析平台是阿里集团统一的全域流量数据分析平台。从页面 &小站 &活动 &APP 等作为切入点,在经过埋点、采集、计算后,构建出宏观的概览数据、坑位效果、类目成交转化、路径分析、用户细分等,致力于打造流量数据分析闭环,快速帮助业务发现流量问题 &提升流量转化。当前,流量采集团队每天需要的日志数据达到万亿级,在写入和查询面临着巨大挑战:

文章图片
#大数据#数据库#linux +1
    共 18 条
  • 1
  • 2
  • 请选择