
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
定期统计数仓表此表及其下游表,近60天的外部访问次数(外部访问指的是非数仓任务使用次数的外部使用,如即席查询,报表查询,接口查询),同样的,和使用方沟通后,无用则归档。每家公司的数据情况和痛点不一样,所以应该根据实际情况,针对痛点去优先治理,而不是死板的按照某本书或某篇文章的治理计划死板的进行。包括数仓中基础的库表信息(表名,表备注,表字段,表的存储空间等),以及任务信息(调度计划、运行耗时、内存

对于数据的销毁,企业应该有严格的管理制度,建立数据销毁的审批流程,并制作严格数据销毁检查表。数据质量管理是对数据从计划、获取、共享、维护、应用、消亡生命周期的每个阶段里可能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平使得数据质量获得进一步提高。数据资产管理是指对数据资产进行规划、控制和提供的一组活动职能,包括开发、执行和监督有关数据的计划、政策

转自:数据库、数据湖、数据仓库、湖仓一体、智能湖仓,分别都是什么鬼 (baidu.com)最近被大数据相关的小词儿,整的有点懵。索性我们就来个专题,聊透数据库、数据仓库、数据湖以及风头正劲的“Lake house”——湖仓一体化。1、数据仓库是个啥?和数据库有什么不同?数据库的基本概念,大家应该都不陌生。如今但凡是个业务系统,都或多或少需要用到数据库。即便我们不直接跟数据库打交道,它们也在背后默默
1、关系数据库在计算机系统的初期,业务系统的雏形刚刚开始,比如记录订单的系统。这个时候,连数据仓库都没有出现。那么用户有数据分析的需求怎么做呢?答案很简单,直接从业务系统来处理数据。这样的场景现在依然存在,比如饭店的收银系统,可以导出一天的交易数据。随着业务系统越来越复杂,数据分析的要求也越来越高。这个时候,继续在业务系统做数据分析就变得不是很合适,原因之一是业务系统的架构并不擅长处理大量的历史数
定期统计数仓表此表及其下游表,近60天的外部访问次数(外部访问指的是非数仓任务使用次数的外部使用,如即席查询,报表查询,接口查询),同样的,和使用方沟通后,无用则归档。每家公司的数据情况和痛点不一样,所以应该根据实际情况,针对痛点去优先治理,而不是死板的按照某本书或某篇文章的治理计划死板的进行。包括数仓中基础的库表信息(表名,表备注,表字段,表的存储空间等),以及任务信息(调度计划、运行耗时、内存

VMWare提供三种工作模式桥接(bridge)、NAT(网络地址转换)和host-only(主机模式)。1、桥接模式在桥接模式下,VMWare虚拟出来的操作系统就像是局域网中的一台独立的主机(主机和虚拟机处于对等地位),它可以访问网内任何一台机器。在桥接模式下,我们往往需要为虚拟主机配置IP地址、子网掩码等(注意虚拟主机的ip地址要和主机ip地址在同一网段)。使用桥接模式的虚拟系统和主机的关系,
转自:https://www.sohu.com/a/396680882_411876?scm=1002.44003c.17c024f.PC_ARTICLE_REC作者:颜博,马蜂窝数仓研发总监1、数据中台架构核心组成我认为的数据中台核心架构包括四大组成部分,具体是:底座是数据基础平台,包括数据采集平台&计算平台&存储平台,这些可以自建也可以使用云计算服务;中间部分两大块是中台的公共
现在各种新名词层出不穷,顶层的有数字城市、智慧地球、智慧城市、城市大脑;企业层面的有数字化转型、互联网经济,数字经济、数字平台; 平台层面的有物联网,云计算,大数据,5G,人工智能,机器智能,深度学习,知识图谱;技术层面的有数据仓库、数据集市、大数据平台、数据湖、数据中台、业务中台、技术中台等等,总之是你方唱罢他登场,各种概念满天飞…在数据技术方面,随着大数据技术的不断更新和迭代,数据管理工具得到
转自:https://www.ruooo.com/VPS/594.html有一些服务商的系统给默认YUM源设置的是国外的,这样就会导致下载速度缓慢。国内几家比较热门的镜像点,下面的镜像全部支持Linux的任何一个发行版的系统。阿里云Linux安装软件镜像源阿里云是最近新出的一个镜像源。得益与阿里云的高速发展,这么大的需求,肯定会推出自己的镜像源。阿里云Linux安装镜像
自2011年以来,大数据旋风以“迅雷不及掩耳之势”席卷中国。毋庸置疑,大数据已然成为继云计算、物联网之后新一轮的技术变革热潮,不仅是信息领域,经济、政治、社会等诸多领域都“磨刀霍霍”向大数据,准备在其中逐得一席之地。中国工程院李国杰院士更是把大数据提升到战略的高度,他表示,数据是与物质、能源一样重要的战略资源。从数据中发现价值的技术正是最有活力的软技术,在数据技术与产业上的落后,将使我们像错过工业