logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

余老师带你学习大数据框架全栈第十三章Hudi第一节核心技术

1.前言1.1为什么产生数据湖数据量比较大,越来越不满足处理结构化的数据,比如说数仓,数仓就是处理结构化数据。什么是结构化数据,就是数据成数据库来的,传统型的数据库有:MySQL数据库、Oracle、SQLserver,从这些库里面过来的数据都是结构化数据。日志、json、xml是属于半结构化数据,结构化数据和半结构化数据就是当前数仓所做的功能。数据湖的产生就是为了解决非结构化数据和二进制数据,主

余老师带你学习大数据框架全栈第十二章Flume第三节简单案例之官方案例

3.1 监控端口数据官方案例实验目的:使用 Flume 监听一个端口,收集该端口数据,并打印到控制台。实验分析:实验步骤:1.切换到hadoop根目录下命令:cd /hadoop/2.安装 netcat 工具1)先查看是否装有nc工具命令:nc –help或 netcat –help图示为未装。安装nc工具命令:sudo yum install -y nc2)给app-12、app-13进行安装命

#flume
到底了