
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Scala入门Scala简介安装Scala编译器和开发环境Scala交互式编程(REPL)Scala初体验Scala概述Scala变量与常量使用类型别名定义变量Scala关键字列表Scala数据类型Scala数据类型层次结构字符串插值Scala条件控制if语句示例if...else语句示例if...else if...else语句示例条件语句返回值Scala任何表达式都有返回值示例代码块“{...
Python环境搭建及Python数据类型下载安装Anaconda运行Python自带DemoPython开发工具Jupyter Notebook介绍PyCharm集成开发环境Python的工程结构Python语句块规范Python的注释方法与常见内置函数Python变量的特点数值类型数值类型操作符列表元组(tuple)列表/元组操作下载安装Anaconda下载Anaconda在官网上下载安装包h
Flink开发流程EnvironmentSource从集合读取数据从文件中读取数据读取本地文件读取HDFS文件Kafka读取数据自定义数据源TransformMapMapFunctionRichMapFunction和其他所有的计算框架一样,Flink也有一些基础的开发步骤以及基础,核心的API,从开发步骤的角度来讲,主要分为四大部分EnvironmentFlink Job在提交执行计算时,需要首
这里写目录标题从一个topic的数据进入另一个topic中利用实时流实现Wordcount功能从一个topic的数据进入另一个topic中创建maven工程添加依赖包dependency><groupId>org.apache.kafka</groupId><artifactId>kafka_2.11</artifactId><versi
Zeppelin安装和配置下载安装包安装Zeppelin配置Zeppelin配置hive解释器使用Zeppelin的hive解释器下载安装包zeppelin安装包提取码:0bw0安装Zeppelin把安装包放进根目录下的software目录下解压Zeppelin到opt目录下[root@hadoop100 software]# tar -zxvf zeppelin-0.8.1-bin-all.tg
使用Zeppelin分析电子商务消费行为分析任务描述需求概述问题分析Customer表Transaction表Store表Review表数据结构连接至Zeppelin电子商务消费行为分析文件提取码:39r1任务描述需求概述对某零售企业最近一年门店收集的数据进行数据分析潜在客户画像用户消费统计门店的资源利用率消费的特征人群定位数据的可视化展现问题分析Customer表customer_details
大数据——Spark RDD算子(四)创建键值对RDD mapToPair、flatMapToPair示例文件mapToPairScala版本Java版本flatMapToPairScala版本Java版本,Spark2.0以上示例文件在同级目录下有一个文件夹in,文件夹in下有一个sample.txt,内容如下aa bb cc aa aa aa dd dd ee ee ee eeff aa bb
HBase基础HBase概述HBase发展历史HBase用户群体HBase应用场景(一)HBase应用场景(二)HBase应用场景(三)HBase应用场景示例Apache HBase生态圈HBase物理架构概述HMasterRegionServerRegion和TableHBase逻辑架构-RowHBase数据管理HBase架构特点HBase ShellHBase服务启动HBase操作HBase基
Spark-SQL自定义函数UDF、UDAF、UDTF自定义函数分类UDFUDAFUDTF自定义函数分类类似有Hive当中的自定义函数,Spark同样可以使用自定义的函数来实现新的功能Spark中的自定义函数有三类:UDF(User-Defined-Function)输入一行,输出一行UDAF(User-Defined Aggregation Function)输入多行,输出一行UDTF(User
项目实战之航班飞行网图分析任务描述问题分析1:数据探索问题分析2:构建航班飞行网图问题分析3:统计航班飞行网图中机场与航线的数量问题分析4:计算最长的飞行航线任务描述需求概述探索航班飞行网图数据构建航班飞行网图使用Spark GraphX完成下列任务统计航班飞行网图中机场的数量统计航班飞行网图中航线的数量计算最长的飞行航线(Point to Point)找出最繁忙的机场找出最重要的飞行航线(Pag







