蜂蜜柚子加苦茶个人主页

@dsjia2970727

蜂蜜柚子加苦茶

2022-11-24 22:12:25 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

大数据——Scala入门

Scala入门Scala简介安装Scala编译器和开发环境Scala交互式编程（REPL）Scala初体验Scala概述Scala变量与常量使用类型别名定义变量Scala关键字列表Scala数据类型Scala数据类型层次结构字符串插值Scala条件控制if语句示例if...else语句示例if...else if...else语句示例条件语句返回值Scala任何表达式都有返回值示例代码块“{...

#scala #大数据 #spark

大数据——Python环境搭建及Python数据类型

Python环境搭建及Python数据类型下载安装Anaconda运行Python自带DemoPython开发工具Jupyter Notebook介绍PyCharm集成开发环境Python的工程结构Python语句块规范Python的注释方法与常见内置函数Python变量的特点数值类型数值类型操作符列表元组（tuple）列表/元组操作下载安装Anaconda下载Anaconda在官网上下载安装包h

#python #大数据 #数据分析

大数据——Flink开发流程

Flink开发流程EnvironmentSource从集合读取数据从文件中读取数据读取本地文件读取HDFS文件Kafka读取数据自定义数据源TransformMapMapFunctionRichMapFunction和其他所有的计算框架一样，Flink也有一些基础的开发步骤以及基础，核心的API，从开发步骤的角度来讲，主要分为四大部分EnvironmentFlink Job在提交执行计算时，需要首

#大数据 #flink #scala +1

大数据——Kafka Stream实时流案例和Flume搭配Kafka联用

这里写目录标题从一个topic的数据进入另一个topic中利用实时流实现Wordcount功能从一个topic的数据进入另一个topic中创建maven工程添加依赖包dependency><groupId>org.apache.kafka</groupId><artifactId>kafka_2.11</artifactId><versi

#java #kafka #大数据

大数据——Zeppelin安装和配置

Zeppelin安装和配置下载安装包安装Zeppelin配置Zeppelin配置hive解释器使用Zeppelin的hive解释器下载安装包zeppelin安装包提取码：0bw0安装Zeppelin把安装包放进根目录下的software目录下解压Zeppelin到opt目录下[root@hadoop100 software]# tar -zxvf zeppelin-0.8.1-bin-all.tg

#大数据 #hadoop #hive

大数据——项目实战（使用Zeppelin分析电子商务消费行为分析）

使用Zeppelin分析电子商务消费行为分析任务描述需求概述问题分析Customer表Transaction表Store表Review表数据结构连接至Zeppelin电子商务消费行为分析文件提取码：39r1任务描述需求概述对某零售企业最近一年门店收集的数据进行数据分析潜在客户画像用户消费统计门店的资源利用率消费的特征人群定位数据的可视化展现问题分析Customer表customer_details

#大数据 #hive #数据仓库

大数据——Spark RDD算子（四）创建键值对RDD mapToPair、flatMapToPair

大数据——Spark RDD算子（四）创建键值对RDD mapToPair、flatMapToPair示例文件mapToPairScala版本Java版本flatMapToPairScala版本Java版本，Spark2.0以上示例文件在同级目录下有一个文件夹in，文件夹in下有一个sample.txt，内容如下aa bb cc aa aa aa dd dd ee ee ee eeff aa bb

#spark #大数据 #java +1

大数据——HBase基础

HBase基础HBase概述HBase发展历史HBase用户群体HBase应用场景（一）HBase应用场景（二）HBase应用场景（三）HBase应用场景示例Apache HBase生态圈HBase物理架构概述HMasterRegionServerRegion和TableHBase逻辑架构-RowHBase数据管理HBase架构特点HBase ShellHBase服务启动HBase操作HBase基

#hadoop #hbase #大数据

大数据——Spark-SQL自定义函数UDF、UDAF、UDTF

Spark-SQL自定义函数UDF、UDAF、UDTF自定义函数分类UDFUDAFUDTF自定义函数分类类似有Hive当中的自定义函数，Spark同样可以使用自定义的函数来实现新的功能Spark中的自定义函数有三类：UDF（User-Defined-Function）输入一行，输出一行UDAF（User-Defined Aggregation Function）输入多行，输出一行UDTF（User

#大数据 #hive #spark +1

大数据——项目实战之航班飞行网图分析

项目实战之航班飞行网图分析任务描述问题分析1：数据探索问题分析2：构建航班飞行网图问题分析3：统计航班飞行网图中机场与航线的数量问题分析4：计算最长的飞行航线任务描述需求概述探索航班飞行网图数据构建航班飞行网图使用Spark GraphX完成下列任务统计航班飞行网图中机场的数量统计航班飞行网图中航线的数量计算最长的飞行航线（Point to Point）找出最繁忙的机场找出最重要的飞行航线（Pag

#大数据 #spark #数据分析

共 17 条

请选择