logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

hive中简单的表格数据清洗操作(实例+图解+代码 一看就懂 一做就废)

首先导入json在清洗之前先介绍环境:hive 、beeline、Zeppelin同时所需的文件在下面的链接中,我祝你心情好????:链接:https://pan.baidu.com/s/123qr-BuTa7nxLxd1LXvH8A 提取码:cz12

#hive#大数据#数据分析
Spark——基于Spark Graphx的图形数据分析

基于Spark Graphx的图形数据分析官网指导https://spark.apache.org/docs/latest/graphx-programming-guide.html#pregel-api一、图计算的好处许多大数据以大规模图或网络的形式呈现许多非图结构的大数据,常会被转换为图模型进行分析图数据结构很好地表达了数据之间的关联性二、图的概念1、图的基本概念图是由顶点集合(vertex)

#大数据
hadoop目录介绍(各目录功能介绍)

hadoop目录1、bin:2、sbin3、etc4、lib5、logs6、include7、libexec8、share目录介绍hadoop的目录首先进入hadoop查看目录挑重要的介绍1、bin:bin目录是Hadoop最基本的管理脚本和使用脚本所在的目录,这些脚本是sbin目录下管理脚本的基础实现,用户可以直接使用这些脚本管理和使用Hadoop2、sbin存放的是我们管理脚本的所在目录,重要

#hadoop#linux#hdfs
Spark——基于Spark Graphx的图形数据分析

基于Spark Graphx的图形数据分析官网指导https://spark.apache.org/docs/latest/graphx-programming-guide.html#pregel-api一、图计算的好处许多大数据以大规模图或网络的形式呈现许多非图结构的大数据,常会被转换为图模型进行分析图数据结构很好地表达了数据之间的关联性二、图的概念1、图的基本概念图是由顶点集合(vertex)

#大数据
到底了