logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

spark编程基础(python版)-- RDD基础

一、Hadoop与spark区别Hadoop虽然已经成为大数据技术的事实标准,但其本身存在很多缺陷。比如,mapreduce计算模型延迟过高,无法实现实时快速计算的需求,只适用于离线批处理,I/O磁盘开销大。spark在借鉴mapreduce优点同时,很好解决了mapreduce存在的缺陷:1、spark计算也属于mapreduce计算,但不局限于map和reduce操作;2、spark提供内计算

#spark
1.2 python列表添加元素的三种方法

列表是序列的一种,可以使用 + 进行链接,这样相当于在第一个列表的末尾添加了另一个列表。list1 = [1,2,3,4]list2 = ['a','b','c']list3 = list1 + list2print(list3)输出结果: [1,2,3,4,'a','b','c']可以看出使用 + 会生成一个新的列表,但是该方法效率不高第一种方法:append()append()方法用于在列表的

#python
到底了