
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
如今的技术圈仿佛按下了倍速键:上周我们还在热议多模态大模型的边界,这周 Agent 架构已成标配,转眼之间,“OpenClaw”又成了极客们手中的新宠。在 EMR Serverless Spark 的世界里,我们没有时间争论一只“虾”是否过时,因为我们正忙着将它处理、加工,并端上企业级数据处理的盛宴。现在,场景变成了这样:“提交一个 PySpark 作业,名字叫‘user-agg’,代码在 OSS
在AI融合领域,阿里云通过 Spark + DLF 全模态湖仓实现文本、音频、视频等多模态数据的统一治理与AI模型训练,而 Flink + Milvus + LLM 构建的实时智能分析决策系统,则支持舆情分析、直播监控等场景的毫秒级AI决策。在企业级治理能力方面,覆盖存储、计算、开发、安全多维度,事前、事中、事后等全方位治理能力;,在支持 Paimon、Iceberg 等主流湖表格式的基础上,将存
在落地实践中,利用 Paimon 与开源 Spark、StarRocks 大数据生态技术栈开放融合的优势,借助 Serverless Spark 先进技术栈,通过 Spark Streaming 技术,快速实现了实时数据入湖的链路,用 Paimon 格式重构了 ODS 层存储机制,实现了亿级设备数据分钟级入湖,实时可查可用,极大提升了数据新鲜度。然而,现有大数据平台基于经典的 Lambda 架构构
业务背景在实际业务使用中,需要经常实时做一些数据分析,包括实时PV和UV展示,实时销售数据,实时店铺UV以及实时推荐系统等,基于此类需求,Confluent+实时计算Flink版 是一个高效的方案。Confluent 是基于 Apache Kafka 提供的企业级全托管流数据服务,由 Apache Kafka 的原始创建者构建,通过企业级功能扩展了 Kafka 的...
2021云栖大会云原生企业级数据湖专场主题:云原生,让数据湖加速迈入3.0时代讲师:贾扬清,阿里云智能高级研究员内容框架:数据湖演进历程存储从「成本中心」到「价值中心」的升级「建湖」「管...
>>>>点击上方蓝字关注我们,获取最新技术资讯开源大数据社区 & 阿里云 EMR 系列直播 第六期主题:EMR spark on ACK产品演示及最佳实践讲...
Jindo 的由来EMR Jindo 是阿里云基于 Apache Spark / Apache Hadoop 在云上定制的分布式计算和存储引擎。Jindo 原是内部的研发代号,取自筋斗...
译者何源(荆杭),阿里云计算平台事业部高级产品专家前言本文翻译自 Altinity 针对 ClickHouse 的系列技术文章。面向联机分析处理(OLAP)的开源分析引擎 ClickHou...
数据湖技术圈本期导读 :【JindoFS 缓存加速】第十二讲主题:Spark 访问 OSS 透明缓存加速讲师:辰山,阿里巴巴计算平台事业部 EMR 技术专家内容框架:JindoFS 缓存...
让算力更普惠,让 AI 更普及!未来十年,阿里云将全面拥抱智能化时代。随着 Serverless 化逐渐成为全新的软件研发范式,阿里云正坚定推进核心产品全面 Serverless 化。其中,开源大数据产品 阿里云E-MapReduce 率先推出 EMR Serverless StarRocks 服务。StarRocks 是一款高性能分析型数据仓库,使用向量化、MPP 架构、可实时更新的列式存储引擎







