简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
这1. 什么是JVM?2. 能说一下JVM的内存区域吗?3. 说一下JDK1.6、1.7、1.8内存区域的变化?4. 为什么使用元空间替代永久代作为方法区的实现?5. 对象创建的过程了解吗?6. 什么是指针碰撞?什么是空闲列表?1. 什么是JVM?JVM——Java虚拟机,它是Java实现平台无关性的基石。Java程序运行的时候,编译器将Java文件编译成平台无关的Java字节码文件(.class
第四章 Hadoop编译源码4.1 前期准备工作1)CentOS联网配置CentOS能连接外网。Linux虚拟机ping www.baidu.com是畅通的注意:采用root角色编译,减少文件夹权限出现问题2)jar包准备(hadoop源码、JDK8、maven、ant 、protobuf)(1)hadoop-3.1.3-src.tar.gz(2)jdk-8u212-linux-x64.tar.g
第二章 Hadoop运行环境搭建2.1 模板虚拟机环境准备1)准备一台模板虚拟机hadoop100,虚拟机配置要求如下:注:本文Linux系统环境全部以CentOS-7.5-x86-1804为例说明模板虚拟机:内存4G,硬盘50G,安装必要环境,为安装hadoop做准备[root@hadoop100 ~]# yum install -y epel-release[root@hadoop100 ~]
边缘计算和云计算的区别是什么?导言一、边缘计算和云计算的区别1. 整体与局部2. 实时与长期3. 分散与集中4.高能耗与低能耗二、边缘计算与云计算的联系1. 协同与互补2. 云边端三位一体导言简单地说,边缘计算是将计算资源部署靠近用户和数据源的网络边缘侧,通过更靠近数据源的位置(如路由器、基站)执行计算,为用户提供高带宽、低延迟、低能耗、高安全的计算服务。边缘计算与云计算,两者最直观的效果区别,
Kafka消费者组三种分区分配策略roundrobin,range,StickyAssignor文章目录1. Range(默认策略)2. RoundRobin3. StickyAssignor一个consumer group中有多个consumer,一个 topic有多个partition,所以必然会涉及到partition的分配问题,即确定那个partition由哪个consumer来消费。Ka
Spark基础篇1、Spark有哪两种算子?2、Spark有哪些聚合类的算子,我们应该尽量避免什么类型的算子?3、如何从Kafka中获取数据?4、RDD创建有哪几种方式?5、Spark并行度怎么设置比较合适?6、Spark如何处理不能被序列化的对象?7、collect功能是什么,其底层是怎么实现的?8、为什么Spark Application在没有获得足够的资源,job就开始执行了,可能会导致什么
文章目录Kafka生产者1 分区策略2 数据可靠性保证3 Exactly Once语义3.3 Kafka消费者3.3.1 消费方式3.3.2 分区分配策略3.3.3 offset的维护3.3.5 故障处理细节Kafka生产者1 分区策略1)分区的原因(1)方便在集群中扩展,每个Partition可以通过调整以适应它所在的机器,而一个topic又可以有多个Partition组成,因此整个集群就可以适
文章目录Kafka工作流程文件存储机制如何通过offset找到对应的消息?Kafka工作流程Kafka 中消息是以topic进行分类的,生产者生产消息,消费者消费消息,都是面向topic的。topic是逻辑上的概念,而partition是物理上的概念,每个partition对应于多个 log 文件,该 log 文件中存储的就是producer生产的数据。Producer生产的数据会被不断追加到该
Git 中的文件可分为五种状态:untrack(未追踪):未跟踪, 此文件在文件夹中, 但并没有加入到git库, 不参与版本控制。 通过git add状态变为Staged;unmodified(未修改):文件已经入库, 未修改, 即版本库中的文件快照内容与文件夹中完全一致。这种类型的文件有两种去处, 如果它被修改, 而变为Modified。如果使用git rm移出版本库, 则成为Untracked
列表推导式、元组推导式、字典推导式、集合推导式列表推导式元组推导式字典推导式集合推导式推导式(又称解析器),是 Python 独有的一种特性。使用推导式可以快速生成列表、元组、字典以及集合类型的数据,因此推导式又可细分为列表推导式、元组推导式、字典推导式以及集合推导式。列表推导式列表推导式可以利用 range 区间、元组、列表、字典和集合等数据类型,快速生成一个满足指定需求的列表。列表推导式的语法