logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Hadoop 大数据之 Mapreduce 笔记一

1)什么是序列化序列化就是把内存中的对象,转换成字节序列(或其他数据传输协议)以便于存储到磁盘(持久化)和网络传输。反序列化就是将收到字节序列(或其他数据传输协议)或者是磁盘的持久化数据,转换成内存中的对象。2)为什么要序列化一般来说,“活的”对象只生存在内存里,关机断电就没有了。而且“活的”对象只能由本地的进程使用,不能被发送到网络上的另外一台计算机。然而序列化可以存储“活的”对象,可以将“活的

文章图片
#大数据#hadoop#mapreduce
大数据实时数仓核心组件 Apache Flink 部署笔记

Flink的官网主页地址:https://flink.apache.org/Flink核心目标,是“数据流上的有状态计算”具体说明:Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。无界数据流:有定义流的开始,但没有定义流的结束;它们会无休止的产生数据;无界流的数据必须持续处理,即数据被摄取后需要立刻处理。我们不能等到所有数据都到达再处理,因为输入是无限的。

文章图片
#大数据#apache#flink
Typora 使用总结 好用主题推荐

Typora 是一款由 Abner Lee 开发的[轻量级] Markdown 编辑器,与其他 Markdown 编辑器不同的是,Typora 没有采用[源代码]和预览双栏显示的方式,而是采用所见即所得的编辑方式

大数据调度apache-dolphinscheduler 安装部署手册

DolphinScheduler 支持多种部署模式,包括单机模式(Standalone)、伪集群模式(PseudoCluster)、集群模式(Cluster)等。

文章图片
#大数据#apache
到底了