
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
ChengYing除了可自动部署运维外,还可以对接Taier部署Hadoop集群,Taier 是一个大数据分布式可视化的DAG任务调度系统,旨在降低ETL开发成本、提高大数据平台稳定性,大数据开发人员可以在 Taier 直接进行业务逻辑的开发,而不用关心任务错综复杂的依赖关系与底层的大数据平台的架构实现,将工作的重心更多地聚焦在业务之中。然后配置SFTP的host,认证方式,默认采用用户名密码方式
在企业数字化转型中,传统BI平台已无法满足AI时代的数据分析需求。指标平台通过构建标准化的语义层,实现指标间的动态关联和因果探究,解决了BI平台部门视角局限、静态展示的痛点。它能自动追溯异常原因,支持跨域分析,如销售下滑与仓储调整的关联。指标平台为AI提供高质量特征,实现敏捷归因,避免潜在损失。未来将向智能发现、自然语言交互等方向发展,推动企业决策从"看数据"到"问逻辑"的升级,成为AI时代不可或

某大型央企是首批全国供应链创新与应用示范企业,在“十四五”规划期内以聚焦供应链管理核心主业作为主要战略发展方向。供应链运营管理以大宗商品贸易为主,其交易往往具有交易量巨大、交易环节复杂、风险交易难识别、风险客商难管控等痛点。随着集团数字化转型不断深化,数据应用方面的需求不断扩展。但集团缺乏统一的,导致在数据应用方面,出现数据价值不凸显、数据标准不统一、数据质量不可控、数据共享不畅通等问题。在此背景
本期我们带大家回顾一下无倦同学的直播分享《Chunjun同步Hive事务表详解》Hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapRe...
在日常工作中,有时会遇到一次性往页面中插入大量数据的场景,在数栈的(以下简称离线)产品中,就有类似的场景。本文将通过分享一个实际场景中的思路,介绍当遇到大量数据时,如何实现高效的,以达到提升页面性能和用户体验的目的。
Apache Hudi 是一个开源的数据湖存储系统,可以在 Hadoop 生态系统中提供实时数据仓库处理功能。Hudi 最早由 Uber 开发,后来成为 Apache 顶级项目。
智能体开发平台面临同质化困境,企业选型需突破三大关键门槛:数据整合、治理体系和复用能力。当前市场存在两种路径——轻量型应用外壳和底座型生产平台,企业应根据自身发展阶段选择。真正有价值的平台需具备四大核心能力:AI-ready数据体系、企业级工具调用、工程化交付形态和可复用资产沉淀。袋鼠云AIWorks凭借数据中台经验,构建了覆盖智能体全生命周期的企业级平台,将数据治理与知识管理融入底层架构。企业选

《能源矿产行业数智化转型白皮书》指出,当前行业正面临安全、低碳和AI需求三大变革力量叠加,企业运营复杂性显著提升。白皮书提出"一体两翼"解决方案框架:"一体"是统一数据底座,解决跨系统数据流动问题;"两翼"包括数据智能和空间智能能力。针对矿山、冶炼、加工和集团四类企业,方案各有侧重:矿山侧重空间智能实现风险前移,冶炼强化数据治理与主题分析
摘要: 随着AI应用从model-centric转向data-centric,多模态数据治理成为关键挑战。企业面临非结构化数据分散、难以检索和关联的问题,导致AI应用难以规模化。袋鼠云数栈推出多模态数据智能平台,通过统一计算存储底座、数据集化管理、多模态数据开发能力及可信数据资产体系,为AI提供可治理、可复用的数据底座。该平台支持结构化与非结构化数据的协同处理,并与外部AI系统灵活对接,助力银行、

本次产品更新聚焦离线开发场景,新增多项智能化与国际化功能:推出AI"代码续写"辅助编程,支持中英文界面切换;优化多引擎支持(DorisSQL/GaussDB9.1/AWS S3等)和跨工作流编排能力;增强数据安全管控(DQL权限校验、Hive表权限配置)。同步改进任务依赖提示、日志实时打印、告警规则等基础功能,并提升Redis写入、文件上传等性能。通过计算引擎适配与架构优化,为企业构建更高效、安全








