logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

[企业数据平台的下一阶段一] 当 Hadoop 拼装架构越来越难支撑 AI,企业真正可行的升级路线,往往不是推倒重来,而是在存量之上做原地加速、旁路验证和渐进式收敛

在很多企业里,Hive 有一份 schema,Kafka 有一份 schema,Elasticsearch、ClickHouse、Redis、应用库、指标平台,各自都有各自的定义。它能生成 SQL,不代表它真的理解业务。所以 Unified Engine 的价值,不是抽象地说“统一”,而是把原本散落在离线、交互式、BI、实时链路之间的重复建设,逐步收回来。但这组数字背后更值得讲的,其实是场景判断:

#hadoop#架构#人工智能
本体论语境下的 Semantic Layer:它在企业 AI 与 Data Agent 构建中的真实作用

现代语义层的重点,已经不仅仅是字段的说明,而是实现度量指标代码化(metrics-as-code)。换句话说,它真正管理的是:指标定义聚合语义可复用的指标有向无环图(DAG)维度约束时间智能规则语义下推能力如果不明确这部分内容,很难全面理解语义层的实际工程价值。因为在企业里,最困难的往往不是“收入”这个名称如何对应,而是更细节的问题,比如:收入是以订单级别还是发票级别为粒度?毛销售额和净销售额的粒

#人工智能#大数据
为啥ChatBI 很难真正能落地

企业级ChatBI落地面临的核心挑战在于语义治理而非自然语言转SQL。演示产品虽能快速生成查询,但实际应用中常因业务口径混乱(如同名指标在不同部门含义不同)导致结果失准。关键在于构建统一语义层,通过指标中心、实体建模、业务域约束等机制,将原始数据转化为AI可理解的业务对象。有效方案需包含指标注册、强制消歧、权限控制等核心功能,分阶段从高频场景向复杂分析扩展。ChatBI的本质并非对话界面,而是企业

#人工智能#数据库
Agent 应用范式下,企业数据基础设施正在重写:为什么云器 Lakehouse 会成为 AI 时代的数据底座

AI正加速从试验走向企业生产应用,Gartner预测到2026年80%企业将使用生成式AI,AI Agent市场规模将达526亿美元。传统数据基础设施面临三大挑战:时效性不足、语义层缺失、执行闭环能力弱。未来数据平台需向语义数据系统演进,具备统一增量计算、业务语义表达和AI原生能力。云器Lakehouse的创新在于将变化处理、语义理解和AI执行整合,为Agent应用提供实时、低成本的数据底座。企业

#人工智能
Agent 应用范式下,企业数据基础设施正在重写:为什么云器 Lakehouse 会成为 AI 时代的数据底座

AI正加速从试验走向企业生产应用,Gartner预测到2026年80%企业将使用生成式AI,AI Agent市场规模将达526亿美元。传统数据基础设施面临三大挑战:时效性不足、语义层缺失、执行闭环能力弱。未来数据平台需向语义数据系统演进,具备统一增量计算、业务语义表达和AI原生能力。云器Lakehouse的创新在于将变化处理、语义理解和AI执行整合,为Agent应用提供实时、低成本的数据底座。企业

#人工智能
Agent 应用范式下,企业数据基础设施正在重写:为什么云器 Lakehouse 会成为 AI 时代的数据底座

AI正加速从试验走向企业生产应用,Gartner预测到2026年80%企业将使用生成式AI,AI Agent市场规模将达526亿美元。传统数据基础设施面临三大挑战:时效性不足、语义层缺失、执行闭环能力弱。未来数据平台需向语义数据系统演进,具备统一增量计算、业务语义表达和AI原生能力。云器Lakehouse的创新在于将变化处理、语义理解和AI执行整合,为Agent应用提供实时、低成本的数据底座。企业

#人工智能
从 Palantir Ontology 到企业 AI 决策系统

企业AI落地面临的核心挑战是模型难以真正理解业务语义并安全执行决策动作。Palantir的Ontology方法通过构建业务对象体系,将数据、规则、动作和治理统一建模,使AI能在受控环境下参与核心运营决策。该方法强调从静态语义层转向可执行的运营层,通过对象化建模、逻辑绑定、动作触发和闭环反馈,解决企业AI"能看不能做"的痛点。但该方案存在建模复杂度高、组织协同难、平台依赖强等实施

#人工智能#大数据
Apache Iceberg vs Apache Paimon :数据湖表格式深度对比与选型指南

摘要: Apache Iceberg 和 Apache Paimon 是两种主流的数据湖表格式,分别针对不同场景优化。Iceberg 以开放性和多引擎兼容性为核心,v3 版本引入删除向量(BinaryDeletionVectors)、行级血缘(RowLineage)和半结构化支持(VARIANT),适合跨云、多引擎协作的企业级湖仓。Paimon 则基于 LSM-Tree 架构,专为流式处理设计,支

#大数据#spark
应用实践 | 物易云通基于 Apache Doris 的实时数据仓库建设

作者|物易云通 / 司机宝大数据负责人 吴凡武汉物易云通网络科技有限公司成立于 2015 年 6 月,总部位于湖北省武汉市东湖高新区。作为国内产业互联网的探索先行者,公司致力于将产业互联网思维与新一代信息技术深化应用于煤炭、建筑、再生资源三大业务领域,以标准化、场景化、数字化的供应链综合服务解决能力,开创互联网化的 “供应链技术 + 物流服务 + 金融场景” 的产融协同新生态。目前公司已成为国内产

#数据仓库#apache#big data
Flink 消费 Kafka 数据实时落Apache doris数据仓库(KFD)

实现 Flink 消费 Kafka 数据实时落Apache doris数据仓库(KFD)1.概述Apache Doris(原百度 Palo)是一款基于大规模并行处理技术的分布式 SQL 数据仓库,由百度在 2017 年开源,2018 年 8 月进入 Apache 孵化器。Apache Doris是一个现代化的MPP分析型数据库产品。仅需亚秒级响应时间即可获得查询结果,有效地支持实时数据分析。Apa

#big data#kafka#数据库
    共 23 条
  • 1
  • 2
  • 3
  • 请选择