logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

R语言与数据挖掘(一)

要点:1)数据可视化:直方图hist()、QQ图qq.plot()、箱图boxplot()、二维箱图bwplot()2)空值处理:查找complete.cases()、空值删除na.omit()、均值/中位值填充mean()/median()3)多元回归:lm()4)回归树:rpart()5)模型选择/交叉验证:6)模型预测:1、问题描述监测和早期预测有害海

(大数据分析-1)HDFS Review

1 HDFS基本原理及介绍1.1 基本原理HDFS仅负责存储数据,mapReduce负责读写数据设计目标:大文件存储(TB、PB)、高容错(软件容错,数据多份拷贝)、高吞吐不适合场景:存储大量小文件、随机读取、低延迟读取1.1.1 HDFS基本概念数据块(block)大文件会被分割为多个block(默认128M存储,小于一个块的文件不会占

#大数据
到底了