
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Sqoop是一种用于在Hadoop和结构化数据存储(如关系数据库)之间高效传输批量数据的工具。Sqoop官网提供了Sqoop1和Sqoop2,Sqoop1只是一个普通的应用程序,通过给定参数就可以运行该程序。Sqoop2拥有服务端的应用程序,简单的功能变得复杂化,但是更加统一化、规范化。

HDFS的介绍、主从节点功能、HDFS架构图、HDFS读写流程、HDFS元数据安全、HDFS客户端管理操作、HDFS的HA架构和联邦机制等等。

MySQL索引的使用、索引的分类、InnoDB索引模型、索引维护、最左前缀原则、覆盖索引、回表、索引下推、change buffer、普通索引和唯一索引的选择等等。

Scala的特点、Scala数据类型、Scala类型转换、Scala运算符、Scala循环控制、Scala的函数式编程、Scala集合的相关操作、Scala面向对象的编程、Scala模式匹配、Scala隐式转换、Scala泛型、Scala正则匹配等等相关内容。基本涵盖了Scala的基本操作。

Flume是一个实时数据流采集框架,是一种分布式的、高可用的服务,可以有效的收集、聚合和移动大量的日志数据。将数据源的数据变成数据流,将数据采集到目标位置中。本质上就是一个数据迁移的过程。官网文档地址。

Apache Doris数据模型、Bitmap函数、聚合函数、Doris性能优化、Doris使用方式、Doris数据库管理、Doris安装部署、数据导入、物化视图、Rollup等等。

MySQL索引的使用、索引的分类、InnoDB索引模型、索引维护、最左前缀原则、覆盖索引、回表、索引下推、change buffer、普通索引和唯一索引的选择等等。

手动搭建CDH版本的大数据平台基础环境的准备搭建zookeeper集群搭建Hadoop的HA架构集群搭建hbase的HA架构的集群搭建elasticsearch分布式集群本次搭建是在虚拟机上面进行Linux环境的搭建,版本为5.14.0,提供的虚拟机为5台。配置的主机名分别为v1,v2,v3,v4,v5基础环境的准备配置了每台虚拟机和其他虚拟机的免密登陆,使用到的linux命令为ssh-keyg
MySQL索引的使用、索引的分类、InnoDB索引模型、索引维护、最左前缀原则、覆盖索引、回表、索引下推、change buffer、普通索引和唯一索引的选择等等。

<!-- Hadoop Client 依赖 --><dependency><groupId>org.apache.hadoop</groupId><artifactId>hadoop-client</artifactId></dependency><!-- HBase Client 依赖 --&g...