logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

一本书讲透数据治理学习总结——第一章

"3877“道法数器核心内容与“66”补充3个战略机制数据战略组织机制数据文化目的:帮助企业形成数据治理的自我驱动、自我进化、可持续发展和长效运营机制8项关键举措理先状与定目标能力成熟度评估路线图规划保障体系建设技术体系建设策略执行与监控绩效考核畅销运营7种技术能力数据梳理与建模元数据管理数据标准管理主数据管理

文章图片
#big data#大数据
数据仓库ETL工具箱——实时ETL系统

建立实时ETL数据仓库的解决方案需要理解不同的整合技术,这个领域体现了具有新技术、新方法、新词汇的全新理念。通过选择合适的实时ETL技术、特征、方法来指导专业实验数据仓库构建实时ETL的四个过程:调研:实时数仓技术的状态、历史以及业务情况描述:区分组织的实时需求的方式、方法评估:针对实时报告以及整合服务机制,对每一个方法提供最合适的技术并进行分析判定:按需求分类,通过选择技术途径以及方法论上指导E

#数据仓库
数据仓库ETL工具箱——数据流主线详解

上篇说到ETL的设计需要同时考虑两条主线,一条是数据流主线,一条是规划与设计主线。二者其一是数据为主导,从数据的抽取、清洗、规格化到加载给“最终用户”;其二是以业务为主导,从需求现状、架构、开发实现到测试发布。两者相辅相成缺一不可啊。下面我们来详细说说数据流主线每一步的含义。数据流主线抽取数据抽取是ETL工具的第一步。企业中存在许多业务系统,包括财务系统、ERP系统、CRM系统、OA系统等。每个系

#数据仓库
数据仓库ETL工具箱——操作

ETL开发完成后,主要工作是执行ETL开发的这些过程

#数据仓库
数据架构——数据架构

数据既是信息技术的产物,又是支撑。经过多年的信息技术的发展,数据已经形成了自己特有的科学领域,包括数据治理、数据分析、数据架构等。由于数据非常复杂,数据架构包含了很多方面,其中以下四个方面最有意义:数据的物理表现形式数据的逻辑联系数据的内部格式数据的文件结构数据架构在各自具有意义的特点上不断演化:大数据给组织带来了新的信息和决策机会,同时也具有着巨大的潜力。大数据和已有系统的整体流程如下:原始大数

#数据仓库
到底了