logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

利用sqoop将hive数据导入导出数据到mysql

运行环境  centos 5.6   Hadoop  Hivesqoop是让hadoop技术支持的clouder公司开发的一个在关系数据库和hdfs,hive之间数据导入导出的一个工具在使用过程中可能遇到的问题:sqoop依赖zookeeper,所以必须配置ZOOKEEPER_HOME到环境变量中。sqoop-1.2.0-CDH3B4依赖hadoop-core-0.20

#mysql#数据库#sqoop
多指标综合评价中指标正向化和无量纲化方法的选择

本文用实例说明了多指标综合评价中,用“倒数逆变换法”进行指标正向化时会完全改变原指标的分布规律,影响综合评价结果的准确性;对三种常用无量纲化方法——极差变换法、标准化法和均值化法的选择使用问题,用实例进行了比较分析。

多重共线性问题的几种解决方法

在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,……,Xk中的任何一个都不能是其他解释变量的线性组合。如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。

2013百度校园招聘数据挖掘工程师

百度2012校园招聘机器学习/数据挖掘工程师(北京)笔试题目 2011.10.16 一.简单题 1. C++中STL vector 相关 (1).push_back函数的内存分配是怎样的? (2).clear函数的内存分配是如何实现的? 2

#数据挖掘#百度#数据结构
数据分析师,数据挖掘工程师和数据研发工程师有什么区别?

数据分析师:基于业务,通过数据分析手段发现和分析业务问题,为决策作支持。数据挖掘工程师:偏技术,通过建立模型、算法、预测等提供一些通用的解决方案,当然也有针对某业务的。数据研发工程师:一般也叫数据开发,搭建仓库搭建、数据的存储、处理、计算处理、报表开发等。

#数据分析#数据挖掘
到底了