logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【数据结构与算法python】归并排序算法的python实现

1、概念解释归并排序是递归算法, 思路是将数据表持续分裂为两半, 对两半分别进行归并排序递归的基本结束条件是:数据表仅有1个数据项,自然是排好序的;缩小规模:将数据表分裂为相等的两半,规模减为原来的二分之一;调用自身:将两半分别调用自身排序,然后将分别排好序的两半进行归并,得到排好序的数据表2、代码实现方法一:def mergeSort(alist):print("Splitting ",alis

#数据结构与算法#python#排序算法
【数据结构与算法python】拓扑排序算法-DFS算法

1、引入很多问题都可转化为图, 利用图算法解决,例如早餐吃薄煎饼的过程,以动作为顶点,以先后次序为有向边,问题是对整个过程而言,如果一个人独自做,所有动作的先后次序?从加料开始?还是从加热烤盘开始?2、分析从工作流程图得到工作次序排列的算法,称为“拓扑排序”,拓扑排序处理一个DAG, 输出顶点的线性序列,使得两个顶点v,w,如果G中有(v,w)边,在线性序列中v就出现在w之前。拓扑排序广泛应用在依

#数据结构与算法#python
【数据结构与算法python】广度优先搜索算法

1、引入由 “ 爱 丽 丝 漫 游 奇 境 ” 的 作 者 LewisCarroll在1878年所发明的单词游戏,从一个单词演变到另一个单词, 其中的过程可以经过多个中间单词,要求是相邻两个单词之间差异只能是1个字母,如FOOL变SAGE:FOOL >> POOL >> POLL >> POLE >> PALE>> SALE >&g

#数据结构与算法#python
【大数据】Hadoop知识学习(5)-hbase

一、Hbase架构在HBase中,表被分割成区域,并由区域服务器提供服务。区域被列族垂直分为“Stores”。Stores被保存在HDFS文件。下面显示的是HBase的结构。注意:术语“store”是用于区域来解释存储结构。HBase有三个主要组成部分:客户端库,主服务器和区域服务器。区域服务器可以按要求添加或删除。主服务器分配区域给区域服务器并在Apache ZooKeeper的帮助下完成这个任

#大数据#hadoop#hbase
【大数据】spark学习(1) - 基础知识

(一)简介spark是一个实现快速通用的集群计算平台。它是由加州大学伯克利分校AMP实验室 开发的通用内存并行计算框架,用来构建大型的、低延迟的数据分析应用程序。它扩展了广泛使用的MapReduce计算模型。高效的支撑更多计算模式,包括交互式查询和流处理。spark的一个主要特点是能够在内存中进行计算,及时依赖磁盘进行复杂的运算,Spark依然比MapReduce更加高效。中间结果输出:基于Map

#大数据#spark
【大数据】spark Yarn的使用(9) - 资源配置查看

方式一:方式二:方式三:Yarn的实际资源通过container,可以设置Yarn的最小、最大内存,一般根据现有的集群资源来分配代码资源——内存和CPU核数举个例子:假设集群中有100G可用内存,20个可用CPU核,则可设置参数如下,尽最大化使用集群资源,提高运行效率num-executors=10,executor-cores=2,executor-memory=10...

#大数据#spark
【大数据】spark Yarn的使用(7) - job、stage、task的理解

Spark-Spark任务中job,stage,task之间的关系:什么是jobJob简单讲就是提交给spark的任务。什么是stageStage是每一个job处理过程要分为的几个阶段。3什么是taskTask是每一个job处理过程要分几为几次任务。Task是任务运行的最小单位。最终是要以task为单位运行在executor中。Job和stage和task之间有什么关系Job----> 一个

#大数据#spark
【大数据】WordCount流程(spark-submit)

一、操作流程(1)构建maven项目①选择maven项目,将Project SDK设置为1.8,然后从Create form archetype中选择scala-archetype-empty-RELEASE②命名Project,然后将GroupId修改为org.flowpp(可选,此处为与flow公司的操作相一致),其他不需要修改③选择maven版本,可直接选择本地下载安装的maven版本(ma

#大数据#spark#maven +1
2022-美团-大数据研发工程师-秋招面经

1、技术一面Q1:自我介绍Q2:介绍字节内存泄漏和OOM的问题Q3:字节的KV存储库、内存和缓存的关系Q4:介绍伴随同行项目Q5:项目是否具有分层,比如dao、util、处理层,也就是spring boot的那一套Q6:数据量级多大、数据存储格式是什么、spark如何读取Q7:数据库索引、B+树、红黑树、B树、B-树、平衡二叉树的区别Q8:spark client和sprak cluster的区别

【大数据】spark Yarn的使用(5) - Driver和Executor

在local模式下 驱动程序driver就是执行了一个Spark Application的main函数和创建Spark Context的进程,它包含了这个application的全部代码。(在那台机器运行了应用的全部代码创建了sparkContext就是driver,以可以说是你提交代码运行的那台机器)Driver:使用Driver这一概念的分布式框架有很多,比如hive,Spark中的Drive

#大数据#hadoop#spark
    共 35 条
  • 1
  • 2
  • 3
  • 4
  • 请选择