
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
余老师带你学习大数据框架全栈第十三章Hudi第一节核心技术
1.前言1.1为什么产生数据湖数据量比较大,越来越不满足处理结构化的数据,比如说数仓,数仓就是处理结构化数据。什么是结构化数据,就是数据成数据库来的,传统型的数据库有:MySQL数据库、Oracle、SQLserver,从这些库里面过来的数据都是结构化数据。日志、json、xml是属于半结构化数据,结构化数据和半结构化数据就是当前数仓所做的功能。数据湖的产生就是为了解决非结构化数据和二进制数据,主
余老师带你学习大数据框架全栈第十二章Flume第三节简单案例之官方案例
3.1 监控端口数据官方案例实验目的:使用 Flume 监听一个端口,收集该端口数据,并打印到控制台。实验分析:实验步骤:1.切换到hadoop根目录下命令:cd /hadoop/2.安装 netcat 工具1)先查看是否装有nc工具命令:nc –help或 netcat –help图示为未装。安装nc工具命令:sudo yum install -y nc2)给app-12、app-13进行安装命
到底了







