kylin 安装配置实验

一、实验环境3台CentOS release 6.4虚拟机，IP地址为192.168.56.101 master192.168.56.102 slave1192.168.56.103 slave2hadoop 2.7.2hbase 1.1.4hive 2.0.0zookeeper 3.4.8kylin 1.5.1（一定要apache-kylin-1.5.1-

wzy0623

25610人浏览 · 2016-04-29 17:43:19

wzy0623 · 2016-04-29 17:43:19 发布

一、实验环境
3台CentOS release 6.4虚拟机，IP地址为
192.168.56.101 master
192.168.56.102 slave1
192.168.56.103 slave2

hadoop 2.7.2
hbase 1.1.4
hive 2.0.0
zookeeper 3.4.8
kylin 1.5.1（一定要apache-kylin-1.5.1-HBase1.1.3-bin.tar.gz包）

master作为hadoop的NameNode、SecondaryNameNode、ResourceManager，hbase的HMaster
slave1、slave2作为hadoop的DataNode、NodeManager，hbase的HRegionServer
同时master、slave1、slave2作为三台zookeeper服务器

需要事先重新编译hadoop源码，使得native库支持snappy

编译hadoop源码，参考：

http://blog.csdn.net/wzy0623/article/details/51263041

二、安装hadoop集群
参考：
http://blog.csdn.net/wzy0623/article/details/50681554

三、安装配置基于独立Zookeeper集群的Hbase
参考：
http://blog.csdn.net/wzy0623/article/details/51241641
http://blog.csdn.net/wzy0623/article/details/51276501

四、安装配置hive
参考：
http://blog.csdn.net/wzy0623/article/details/50685966

五、添加hive_dependency环境变量

export  hive_dependency=/home/grid/hive/conf:/home/grid/hive/lib/*:/home/grid/hive/hcatalog/share/hcatalog/hive-hcatalog-core-2.0.0.jar

六、把hive安装目录拷贝到Hadoop集群的其他节点

scp -r hive slave1:/home/grid/
scp -r hive slave2:/home/grid/

七、在每个节点中配置如下环境变量：

JAVA_HOME
HADOOP_HOME
HBASE_HOME
HADOOP_HDFS_HOME
HIVE_HOME
HADOOP_COMMON_HOME
JAVA_HOME
HADOOP_YARN_HOME
ZOOKEEPER_HOME
KYLIN_HOME
HADOOP_MAPRED_HOME
hive_dependency

八、安装配置kylin
# 在master上执行以下命令

cd /home/grid/
tar -zxvf apache-kylin-1.5.1-HBase1.1.3-bin.tar.gz
ln -s apache-kylin-1.5.1-bin kylin

vi /home/grid/kylin/bin/kylin.sh
需要对此脚本做两点修改：
1. export KYLIN_HOME=/home/grid/kylin # 改成绝对路径
2. export HBASE_CLASSPATH_PREFIX=${tomcat_root}/bin/bootstrap.jar:${tomcat_root}/bin/tomcat-juli.jar:${tomcat_root}/lib/*:$hive_dependency:$HBASE_CLASSPATH_PREFIX # 在路径中添加$hive_dependency

九、测试
1. 分别在三台机器上启动zookeeper

/home/grid/zookeeper/bin/zkServer.sh start

2. 在master启动其它kylin依赖的服务

$HADOOP_HOME/sbin/start-dfs.sh
$HADOOP_HOME/sbin/start-yarn.sh
$HADOOP_HOME/sbin/mr-jobhistory-daemon.sh start historyserver
~/mysql/bin/mysqld &
nohup $HIVE_HOME/bin/hive --service metastore > /tmp/grid/hive_metastore.log 2>&1 &
/home/grid/hbase/bin/start-hbase.sh

3. 在master启动kylin

cd /home/grid/kylin/bin
./kylin.sh start

4. 测试kylin自带的例子
（1）运行${KYLIN_HOME}/bin/sample.sh，并重启kylin服务器
${KYLIN_HOME}/bin/sample.sh
${KYLIN_HOME}/bin/kylin.sh stop
${KYLIN_HOME}/bin/kylin.sh start

（2）使用ADMIN/KYLIN作为用户名/密码登录以下URL，在左上角的project下拉列表中选择'learn_kylin'项目
http://192.168.56.101:7070/kylin

（3）选中'kylin_sales_cube'示例立方体，点击'Actions'->'Build'，选择一个截止日期，本试验中选择的是'2012-04-01'

（4）在'Monitor'标签中通过刷新页面检查进度条，直到100%

（5）在'Insight'标签中执行下面的SQL查询：
select part_dt, sum(price) as total_selled, count(distinct seller_id) as sellers from kylin_sales group by part_dt order by part_dt

（6）在hive中执行同一个SQL查询，验证kylin的查询结果

Build成功的模型标签如图1所示

图1

Build成功的监控标签如图2所示

图2

查询执行和结果分别如图3、图4所示

图3

图4

Build成功后，hive中建立了3个表，如图5所示

图5

Build成功后，hbase中建立了2个表，如图6所示

图6

注意：
1. kylin、hadoop、hbase、hive的版本一定要匹配。
2. 需要把hive拷贝到集群中的每个节点中。
3. 需要修改kylin.sh脚本。
4. 需要在每个节点中配置如下环境变量：
HADOOP_HOME
HBASE_HOME
HADOOP_HDFS_HOME
HIVE_HOME
HADOOP_COMMON_HOME
JAVA_HOME
HADOOP_YARN_HOME
ZOOKEEPER_HOME
KYLIN_HOME
HADOOP_MAPRED_HOME

参考：
http://kylin.apache.org/docs15/tutorial/kylin_sample.html
http://www.myexception.cn/open-source/1940509.html

向您推荐>>Eolink开发者社区

权威｜前沿｜技术｜干货｜国内首个API全生命周期开发者社区

更多推荐

深入理解 Mocha 测试框架：从零实现一个 Mocha

前言什么是自动化测试自动化测试在很多团队中都是Devops环节中很难执行起来的一个环节，主要原因在于测试代码的编写工作很难抽象，99%的场景都需要和业务强绑定，而且写测试代码的编写工作量往往比编写实际业务代码的工作量更多。在一些很多业务场景中投入产出比很低，适合写自动化测试的应该是那些中长期业务以及一些诸如组件一样的基础库。自动化测试是个比较大的概念，其中分类也比较多，比如单元测试，端对端测试，集

云原生

ELK实现containerd的容器日志采集展示【基于logging的全栈监测】

企业级ELK Stack构建介绍

云原生

(20200916 Solved)docker-compose up创建容器自动退出

问题描述如题，创建容器后自动退出了。并且docker start container无效解决方案原因是缺失了控制终端的配置，需要在docker-compose.yml中增加tty:true ，有时候这样也不行，需要再增加一个command:/bin/bash，命令不一定是这个，需要是一个不会退出的命令，然后用-d后台启动容器。Referencesdocker-compose启动容器后自动退出...

云原生

所有评论(0)

查看更多评论

wzy0623

@wzy0623

已为社区贡献4条内容