logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

《大数据之路:阿里巴巴大数据实践》总述-读书笔记

今天花了些时间较为详细的阅读了《大数据之路:阿里巴巴大数据实践》,主要内容如下及后续篇幅。从下至上依次分为数据采集层、数据计算层、数据服务层、数据应用层。   数据采集层:以DataX为代表的数据同步工具和同步中心。   数据计算层:以MaxComputer为代表的离线数据存储和计算平台。   数据服务层:以RDS为代表的数据库服务(接口或者视图形式的数据服务)。   数据应用层:包含流量分析平台

#数据仓库#big data#大数据
《大数据之路:阿里巴巴大数据实践》读书笔记---第四篇 数据应用篇

四、数据应用篇16.数据应用本篇主要介绍两个应用:提供给外部商家使用的数据产品平台-生意参谋和服务于阿里巴巴内部的数据产品平台16.1 生意参谋作为大数据公司,阿里巴巴在推动业务数据化的同时,也在不断地帮助商家实现数据业务化。在对外产品方面,阿里巴巴以“生意参谋”作为官方统一的数据产品平台,为商家提供多种多样化,普惠性的数据赋能;截止2016财年,生意参谋累计服务商家已超过2000万,越服务商家超

数据仓库【事实表,维度,度量,指标之间的关系】

事实表:每个数据仓库都包含一个或者多个事实数据表。事实数据表可能包含业务销售数据,如销售商品所产生的数据,与软件中实际表概念一样。维度:说明数据,维度是指可指定不同值的对象的描述性属性或特征。例如,地理位置的维度可以包括“纬度”、“经度”或“城市名称”。“城市名称”维度的值可以为“旧金山”、“柏林”或“新加坡”。指标:衡量数据,指标是指可以按总数或比值衡量的具体维度元素。例如,维度“城市”可以关联

#数据仓库#数据库#数据挖掘
数据仓库【事实表,维度,度量,指标之间的关系】

事实表:每个数据仓库都包含一个或者多个事实数据表。事实数据表可能包含业务销售数据,如销售商品所产生的数据,与软件中实际表概念一样。维度:说明数据,维度是指可指定不同值的对象的描述性属性或特征。例如,地理位置的维度可以包括“纬度”、“经度”或“城市名称”。“城市名称”维度的值可以为“旧金山”、“柏林”或“新加坡”。指标:衡量数据,指标是指可以按总数或比值衡量的具体维度元素。例如,维度“城市”可以关联

#数据仓库#数据库#数据挖掘
元数据与数据治理|Atlas 总结

ApacheAtlas可监控数据的流向ApacheRanger统一授权管理

#大数据
元数据与数据治理|apache-atlas-0.8.4 源码编译和安装部署(apache版本)

Atlas官网地址:https://atlas.apache.org/文档查看地址:https://atlas.apache.org/0.8.4/index.html下载地址:https://www.apache.org/dyn/closer.cgi/atlas/0.8.4/apache-atlas-0.8.4-sources.tar.gz1.安装前环境准...

元数据与数据治理|Atlas 基础理论

1.Apache Atlas 产生背景• 面对海量且持续增加的各式各样的数据对象,你是否有信心知道哪些数据从哪里来以及它如何随时间而变化?采用Hadoop必须考虑数据管理的实际情况,元数据与数据治理成为企业级数据湖的重要部分• 为寻求数据治理的开源解决方案,Hortonworks公司联合其他厂商与用户于2015年发起数据治理倡议,包括数据分类、集中策略引擎、数据血缘、安全和...

数据治理【数据安全管理】

1、概念维基百科:“数据质量管理是对数据从计划、获取、存储、共享、维护、应用、消亡生命周期的每个阶段里可能引发的数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平使得数据质量获得进一步提高。数据质量管理的终极目标是通过可靠的数据提升数据在使用中的价值,并最终为企业赢得经济效益。个人理解:“数据质量管理不单纯是一个概念,也不单纯是一项技术、也不单纯是一个系统,更

数据治理系列5:浅谈数据质量管理

“数据质量管理是对数据从计划、获取、存储、共享、维护、应用、消亡生命周期的每个阶段里可能引发的数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平使得数据质量获得进一步提高。数据质量管理的终极目标是通过可靠的数据提升数据在使用中的价值,并最终为企业赢得经济效益。”——以上内容摘自百度百科。笔者观点:“数据质量管理不单纯是一个概念,也不单纯...

数据治理系列4:主数据管理实施四部曲概论

导读:我们知道主数据项目的建设是一个循序渐进、持续优化的过程,不可一蹴而就。个人认为主数据管理项目从咨询规划到落地实施再到初步见效需要经历四个阶段,而每个阶段都是必经阶段,每个阶段均可独立成章,所以这里是四部曲,不是四步曲。主数据项目建设从方法上,分为以下四部,简单归结为12个字:“摸家底、建体系、接数据、抓运营”!1.摸家底摸家底需要全面调研和了解企...

    共 27 条
  • 1
  • 2
  • 3
  • 请选择