logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据集市与数据仓库

数据仓库是一个面向主题的、集成的、相对稳定的数据存储库,用于支持企业决策制定。它从不同的数据源中提取、转换和加载数据,以创建一个一致的、可信的数据集。数据仓库通常面向企业全局,包含各个部门的数据,是整个企业数据的集中存储。数据仓库通常采用星型或雪花型的模式,用于支持多维分析(OLAP)。

文章图片
#大数据#数据库开发#数据仓库 +2
华为面试题及答案——机器学习(二)

偏差是指模型预测值与真实值之间的系统性误差。偏差反映了模型在训练数据上的拟合能力,即模型对数据中模式的捕捉能力。高偏差通常意味着模型过于简单,不能很好地捕捉数据的复杂关系。低偏差:模型能够较好地拟合训练数据,捕捉数据中的模式。高偏差:模型对数据中的模式捕捉不足,通常表现为欠拟合。

文章图片
#机器学习#人工智能#数据库开发 +2
华为面试题及答案——机器学习(二)

偏差是指模型预测值与真实值之间的系统性误差。偏差反映了模型在训练数据上的拟合能力,即模型对数据中模式的捕捉能力。高偏差通常意味着模型过于简单,不能很好地捕捉数据的复杂关系。低偏差:模型能够较好地拟合训练数据,捕捉数据中的模式。高偏差:模型对数据中的模式捕捉不足,通常表现为欠拟合。

文章图片
#机器学习#人工智能#数据库开发 +2
最简单方法解决启动hive时报错:Exception in thread “main“ java.lang.RuntimeException: org.apache.hadoop.hdfs.serve

相信很多人和我一样在启动完集群之后,通过“lsof -i:10000”检测是否启动成功时会遇到如下图这种情况:等待许久依旧无法启动成功,从而DataGrip无法连接数据库。经过回头检验发现在启动metastore后,hive检验时报错如下图:很容易我们可以关注到:这是因为我们在某次关闭虚拟机时,hadoop没正常关闭,系统自动启动了保护模式!

文章图片
#hadoop#hive#java
数仓分层——ODS、DW、ADS

ODS(Operational Data Store,运营数据存储)是数据仓库体系结构中的一个重要组成部分,通常作为数据仓库架构中的第一个层次或者与原始数据层紧密相关。ODS 层主要用于存储和处理来自业务应用系统的实时、操作性数据,提供给业务用户和决策者进行日常的操作性查询和分析。数据来源: ODS 层的数据主要来自于组织内部的业务应用系统,如企业资源计划(ERP)、客户关系管理(CRM)、销售、

文章图片
#大数据#数据库开发#数据仓库 +1
到底了