工作日志——基于k8s构建可访问cassandra的spark集群

继续本周的工作，上一篇介绍了搭建简易spark集群的方法，这篇介绍一下搭建可访问cassandra的spark集群。

小天屎

2123人浏览 · 2016-04-29 11:26:43

小天屎 · 2016-04-29 11:26:43 发布

继续本周的工作，上一篇介绍了搭建简易spark集群的方法，这篇介绍一下搭建可访问cassandra的spark集群。

前提条件

已搭建好kubernetes集群，且开启kube-dns

集群搭建

启动spark-master

kubectl create -f yaml/spark-master-service.yaml
kubectl create -f yaml/spark-master-controller.yaml

启动spark-worker

kubectl create -f yaml/spark-worker-controller.yaml

启动cassandra

kubectl create -f yaml/cassandra-service.yaml
kubectl create -f yaml/cassandra.yaml

启动spark-driver

kubectl create -f yaml/spark-driver.yaml

使用示例

创建keyspace和table


#进入cql命令行

kubectl exec -ti cassandra -- /usr/bin/cqlsh cassandra


#在cql中创建keyspace和table

cqlsh> CREATE KEYSPACE test WITH replication = {'class': 'SimpleStrategy', 'replication_factor': 1 };
cqlsh> CREATE TABLE test.kv(key text PRIMARY KEY, value int);
cqlsh> INSERT INTO test.kv(key, value) VALUES ('key1', 1);
cqlsh> INSERT INTO test.kv(key, value) VALUES ('key2', 2);
cqlsh> select * from test.kv;
key  | value
------+-------
key1 |     1
key2 |     2

使用spark-driver访问cassandra


#进入spark-shell

kubectl exec -ti <spark-pod-name> spark-shell


#访问cassandra，获取test.kv表的大小

scala> sc.stop
scala> import com.datastax.spark.connector._
scala> import org.apache.spark._
scala> val conf = new SparkConf()
scala> conf.set("spark.cassandra.connection.host", "cassandra")
scala> val sc = new SparkContext("local[2]", "Cassandra Connector Test", conf)
scala> val table = sc.cassandraTable("test", "kv")
scala> table.count
res2: Long = 2

镜像构建说明

spark镜像构建参考这里。是基于上一篇使用的镜像和spark-cassandra-connector构建的镜像。
cassandra镜像可参考kubernetes示例。

K8S/Kubernetes

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐

【深度】阿里巴巴万级规模 K8s 集群全局高可用体系之美

作者 | 韩堂、柘远、沉醉来源 | 阿里巴巴云原生公众号前言台湾作家林清玄在接受记者采访的时候，如此评价自己 30 多年写作生涯：“第一个十年我才华横溢，‘贼光闪现’，令周边黯然失色；第二个十年，我终于‘宝光现形’，不再去抢风头，反而与身边的美丽相得益彰；进入第三个十年，繁华落尽见真醇，我进入了‘醇光初现’的阶段，真正体味到了境界之美”。长夜有穷，真水无香。领略过了 K8s“身在江

K8S/Kubernetes

如何基于 K8s 构建下一代 DevOps 平台？

作者 | 孙健波（天元）导读：当前云原生 DevOps 体系现状如何？面临哪些挑战？如何通过 OAM 解决云原生 DevOps 场景下的诸多问题？云原生开发应用模型 OAM(Open Application Model) 社区核心成员孙健波将为大家一一解答，并分享如何基于 OAM 和 Kubernetes 打造无限能力的下一代 DevOps 平台。什么是 DevOps？为什么基于 Kub