logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Hadoop 大数据基础篇(零)

Hadoop是一个分布式计算平台,能够允许使用编程模型在集群上对大型数据集进行分布式处理,主要解决海量数据的存储和海量数据的分析计算 问题。HDFS(分布式文件存储平台):用于存储大规模数据。MapReduce(计算引擎):用于数据的并行处理。YARN(资源调度平台):用于资源管理和任务调度。以上是对Hadoop基础知识的简要介绍。Hadoop作为大数据处理的核心技术之一,其高扩展性、低成本和高效

文章图片
#hadoop#大数据#分布式 +3
经典sql题(四)查找学生成绩排名第二的学科

本文将通过一个示例,展示如何使用 SQL 中的窗口函数来找出每个学生的第二高分数及其对应的学科。我们首先需要为每个学生的分数生成一个排名,以便后续筛选。我们将为每个学生的分数生成排名,并使用四个不同的窗口函数。, 和 `PERCENT_RANK()。

文章图片
#sql#数据库#数据仓库 +1
MySQL基础知识(一)

数据库引擎是数据库管理系统(DBMS)的核心组件之一,负责数据的存储、查询、更新和管理。不同的引擎有不同的特性和适用场景。事务是数据库操作的一个基本单元,可以包含一个或多个SQL语句。事务的特点是原子性:要么全部执行成功,要么全部失败。脏读:一个事务读取了未提交的其他事务的数据,如果那个事务最终被回滚,读取的数据就会变得不准确。不可重复读:同一事务在两次查询之间,其他事务可能修改了数据,从而导致结

文章图片
#mysql#数据库#数据仓库 +2
关于从零到一搭建数仓

从零到一的搭建过程指的是从无到有地构建一个完整的数据仓库系统。这包括定义业务需求、选择技术栈、设计数据模型、开发ETL流程、部署和维护数据仓库等一系列步骤。这一过程通常需要大量的时间和资源投入。

文章图片
#大数据#分布式#数据仓库
到底了