
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
R语言与数据挖掘(一)
要点:1)数据可视化:直方图hist()、QQ图qq.plot()、箱图boxplot()、二维箱图bwplot()2)空值处理:查找complete.cases()、空值删除na.omit()、均值/中位值填充mean()/median()3)多元回归:lm()4)回归树:rpart()5)模型选择/交叉验证:6)模型预测:1、问题描述监测和早期预测有害海
(大数据分析-1)HDFS Review
1 HDFS基本原理及介绍1.1 基本原理HDFS仅负责存储数据,mapReduce负责读写数据设计目标:大文件存储(TB、PB)、高容错(软件容错,数据多份拷贝)、高吞吐不适合场景:存储大量小文件、随机读取、低延迟读取1.1.1 HDFS基本概念数据块(block)大文件会被分割为多个block(默认128M存储,小于一个块的文件不会占
(大数据分析-3)HBASE Review
hbase原理回顾
到底了







