logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Trae VS. Lingma,字节和阿里的AI编辑器来了!

在AI技术迅猛发展的2025年,AI IDE出现了cursor、trae、windsurf、Lingma,插件有我们熟知的copilot、cline等等。作为AI原生的开发环境工具,通义灵码AI IDE深度适配了最新的千问3大模型,并全面集成通义灵码插件能力,具备编程智能体、行间建议预测、行间会话等功能。在多模态交互上,Trae支持自然语言命令,用户可以用通俗易懂的语言告诉Trae要做的事情,如"

#人工智能#编辑器
基于Kafka+Flink+Redis的电商大屏实时计算案例

前言一年一度的双11又要到了,阿里的双11销量大屏可以说是一道特殊的风景线。实时大屏(real-time dashboard)正在被越来越多的企业采用,用来及时呈现关键的...

大数据核心框架更新周报|ClickHouse多版本齐发、Fluss0.9发布、Delta Lake引入Catalog管理表

表级查询超时是一个实用的运维能力补充,对于存在个别慢查询表的集群有直接价值。:一周发布 5 个版本,看起来密集,但实际上是 ClickHouse 多分支并行维护策略的常规节奏,主要内容是各分支的安全补丁和 Bug 修复。Delta Lake 4.1.0 的 Catalog 管理表和 ClickHouse 26.2 的 BigLake 集成反映了同一个方向:Catalog 的角色正在从被动的"表在哪

#大数据#clickhouse
2025年Apache社区新晋顶级项目名单,你的技术栈该升级了。

Uniffle 通过将 Shuffle 服务从计算引擎中彻底解耦,构建一个独立、可扩展、可共享的远程 Shuffle Service,使得计算任务可以更加专注于计算本身,而 Shuffle 数据的存储、传输与容错交由专门的服务负责。Gravitino 的价值在于提供一个跨系统、跨引擎的统一元数据视图,将数据资产、权限、血缘、标签等能力集中管理。在现实生产环境中,Spark、Flink、Java、S

#apache
【2025年下半】PaimonxDoris湖仓一体方案各大公司生产实践和优化总结

Paimon作为数据湖存储,核心优势体现在存储层:其开放格式(兼容 Spark、Flink、Trino等多引擎)、基于对象存储(S3、HDFS)的 PB 级弹性扩展能力,以及对事务、Schema 演进的原生支持,使其成为海量异构数据的"统一存储基座",兼顾低成本与兼容性。只需要在DWS层,创建一张主键聚合表。支持基于 Paimon 的物化视图,包括分区级别的增量物化视图构建,以及本文后续将要介绍的

Doris x Paimon湖仓一体建设技术要点

另外,Iceberg,Hudi 等都提供了开放式的元数据管理能力,不管元数据是存储在 Doris 本身,还是存储在 Hive Meta store,或者存储在其它统一元数据中心,都可以通过一些对外公开的 API 对这些数据进行管理。「数据分层建模,ODS层在 LakeHouse 中,DWD,DWS,ADS 层的数据加工和数据服务在可以在Doris中,充分利用其性能优势,此外还可以将其加工好的数据再

基于Apache Paimon实现流式数仓实践

300万字!全网最全大数据学习面试社区等你来!摘要本文主要介绍作为供应链物流服务商海程邦达在数字化转型过程中采用 Paimon 实现流式数仓的落地方案。我们提供一个适用于 k8s 环境并且易于上手的生产操作手册,旨在帮助读者快速掌握 Paimon 的使用方法。公司业务情况介绍大数据技术痛点以及选型生产实践问题排查分析未来规划01公司业务情况介绍海程邦达集团一直专注于供应链物流领域,通过打造优秀的国

云原生架构下B站Flink存算分离的改造实践

300万字!全网最全大数据学习面试社区等你来!1. 背景在当前整个行业及公司内部降本增效的大背景下,B站内部也在积极推进实时与在线业务资源的整合,往云原生架构迁移,统一资源池与调度,提升资源利用效率。不过面临的现实问题就是,不同业务场景下,资源的规格诉求不尽相同。在线的业务资源池,由于在线业务的属性,一般只具备很强的计算能力而基本不带存储以及io能力。Flink虽然是一个计算引擎,但是由于其sta

#云原生#架构#flink +2
数据治理体系建设与实践

全网最全大数据面试提升手册!01数据治理建设路径1.业务数字化的目的是打造一体化的业务流、信息流与数据流从企业整体经营管理的角度,战略制定及分解—领域业务目标制定—业务方案设计—业务需求识别 & 信息系统功能及数据库设计—数据汇聚及分析—业务目标监测及改善,这个过程会有层层信息耗散,全局数据治理的目的就是利用体系机制保障最大程度减少这个耗散或补足耗散的部分,让数据尽可能的还原企业的业务事.

#数据库#大数据#运维
Atlas血缘分析在数据仓库中的实战案例

点击上方蓝色字体,选择“设为星标”回复"面试"获取更多惊喜Hi,我是王知无,一个大数据领域的原创作者。放心关注我,获取更多行业的一手消息。目录一、应用1.1 执行SQL1.2 手写的数据...

#数据仓库#大数据#hadoop +2
    共 68 条
  • 1
  • 2
  • 3
  • 7
  • 请选择