flink on k8s

胖胖胖胖胖虎

674人浏览 · 2022-12-02 16:55:56

胖胖胖胖胖虎 · 2022-12-02 16:55:56 发布

参数：https://nightlies.apache.org/flink/flink-docs-release-1.16/zh/docs/deployment/config/#kubernetes-pod-template-file

FROM k8s-docker-registry-node:5000/flink:doris-hbase-elasticsearch-jedis

RUN mkdir -p /etc/hadoop
RUN mkdir -p /etc/hive
RUN mkdir -p /opt/ssl/yunkong-test-env
RUN mkdir -p /opt/ssl/yunkong-pro-env

COPY hadoop /etc/hadoop
COPY hive /etc/hive
COPY ssl/client.truststore.jks /opt/ssl
COPY ssl/yunkong-test-ssl /opt/ssl/yunkong-test-env
COPY ssl/yunkong-pro-ssl /opt/ssl/yunkong-pro-env
COPY flink/conf /opt/flink/conf
COPY v2x-1.0-SNAPSHOT.jar /opt

/opt/flink/bin/flink run-application \
--target kubernetes-application \
-Dkubernetes.namespace=default \
-Dkubernetes.service-account=flink-service-account \
-Dkubernetes.cluster-id=flink-k8s-cluster \
-Dkubernetes.container.image=k8s-docker-registry-node:5000/flink-jar:v2x \
-Dstate.checkpoints.dir=hdfs://hdfs-namenode-service:9000/flink/checkpoints \
-Dstate.savepoints.dir=hdfs://hdfs-namenode-service:9000/flink/savepoints \
-Dexecution.checkpointing.interval=120s \
-Dexecution.checkpointing.mode=EXACTLY_ONCE \
-Dstate.backend=filesystem \
-Dkubernetes.rest-service.exposed.type=NodePort  \
-Drestart-strategy=failure-rate  \
-Drestart-strategy.failure-rate.delay=1s  \
-Drestart-strategy.failure-rate.failure-rate-interval=5s \
-Drestart-strategy.failure-rate.max-failures-per-interval=1  \
-Dtaskmanager.memory.process.size=2048m \
-Djobmanager.memory.process.size=1024m \
-Dexternal-resource.limits.kubernetes.cpu=2000m \
-Dexternal-resource.limits.kubernetes.memory=2Gi \
-Dexternal-resource.requests.kubernetes.cpu=1000m \
-Dexternal-resource.requests.kubernetes.memory=1Gi \
-Dkubernetes.taskmanager.cpu=1 \
-Dkubernetes.jobmanager.replicas=1 \
-Dtaskmanager.numberOfTaskSlots=4 \
-c com.xxx.xxx.xxx.xxx \
local:///opt/v2x-1.0-SNAPSHOT.jar

在这里插入图片描述

问题记录

User “system:serviceaccount:default:default” cannot get resource “services” in API group “” in the namespace “default”

在这里插入图片描述
参考：https://cloud.tencent.com/developer/ask/sof/1920490/answer/2610301

kind: ClusterRole
apiVersion: rbac.authorization.k8s.io/v1
metadata:
  namespace: default
  name: service-reader
rules:
- apiGroups: ["apps"] # "" indicates the core API group
  resources: ["services", "configmaps", "events", "endpoints", "deployments", "persistentvolumes", "persistentvolumeclaims", "storageclasses"]
  verbs: ["get", "watch", "list", "create", "update", "patch"]
- apiGroups: [""] # "" indicates the core API group
  resources: ["services", "configmaps", "events", "endpoints", "deployments", "persistentvolumes", "persistentvolumeclaims", "storageclasses"]
  verbs: ["get", "watch", "list", "create", "update", "patch"]

kubectl create clusterrolebinding service-reader-pod --clusterrole=service-reader  --serviceaccount=default:default

root@flink-jobmanager-0:/opt/flink/bin# /opt/flink/bin/flink run-application --target kubernetes-application -Dkubernetes.namespace=default -Dkubernetes.service-account=flink-service-account -Dkubernetes.cluster-id=flink-k8s-cluster -Dkubernetes.container.image=k8s-docker-registry-node:5000/flink-jar:v2x -Dstate.checkpoints.dir=hdfs://hdfs-namenode-service:9000/flink/checkpoints -Dstate.savepoints.dir=hdfs://hdfs-namenode-service:9000/flink/savepoints -Dexecution.checkpointing.interval=120s -Dexecution.checkpointing.mode=EXACTLY_ONCE -Dstate.backend=filesystem -Dkubernetes.rest-service.exposed.type=NodePort  -Drestart-strategy=failure-rate  -Drestart-strategy.failure-rate.delay=1s  -Drestart-strategy.failure-rate.failure-rate-interval=5s -Drestart-strategy.failure-rate.max-failures-per-interval=1 -Dtaskmanager.memory.process.size=2048m -Djobmanager.memory.process.size=1024m -Dexternal-resource.limits.kubernetes.cpu=2000m -Dexternal-resource.limits.kubernetes.memory=2Gi -Dexternal-resource.requests.kubernetes.cpu=1000m -Dexternal-resource.requests.kubernetes.memory=1Gi -Dkubernetes.taskmanager.cpu=1 -Dkubernetes.jobmanager.replicas=1 -Dtaskmanager.numberOfTaskSlots=4 -c com.nufront.bigdata.v2x.job.ExpressCarV2xRTData2PlatformTestEnv1111 local:///opt/v2x-1.0-SNAPSHOT.jar

...
2022-12-02 16:16:56,929 INFO  org.apache.flink.kubernetes.KubernetesClusterDescriptor      [] - Create flink application cluster flink-k8s-cluster successfully, JobManager Web Interface: http://10.1.0.1:63925

在这里插入图片描述

# List running job on the cluster
$ /opt/flink/bin/flink list --target kubernetes-application -Dkubernetes.cluster-id=flink-k8s-cluster
# Cancel running job
$ /opt/flink/bin/flink cancel --target kubernetes-application -Dkubernetes.cluster-id=flink-k8s-cluster <jobId>

在 flink pod 中部署完 flink on k8s 无法连接以下路径

在这里插入图片描述

savepoint 恢复

/opt/flink/bin/flink run-application --target kubernetes-application \
-s hdfs://hdfs-namenode-service:9000/flink-savepoints/savepoint-25b5a1-6fd30c8ce08b \
-Dkubernetes.namespace=default \
-Dkubernetes.service-account=flink-service-account \
-Dkubernetes.cluster-id=flink-v2x-doris \
-Dkubernetes.container.image=k8s-docker-registry-node:5000/flink-jar:v2x \
-Dstate.checkpoints.dir=hdfs://hdfs-namenode-service:9000/flink/checkpoints \
-Dstate.savepoints.dir=hdfs://hdfs-namenode-service:9000/flink/savepoints \
-Dexecution.checkpointing.interval=120s \
-Dexecution.checkpointing.mode=EXACTLY_ONCE \
-Dstate.backend=filesystem \
-Dkubernetes.rest-service.exposed.type=NodePort  \
-Drestart-strategy=failure-rate  \
-Drestart-strategy.failure-rate.delay=1s  \
-Drestart-strategy.failure-rate.failure-rate-interval=5s \
-Drestart-strategy.failure-rate.max-failures-per-interval=1  \
-Dtaskmanager.memory.process.size=2048m \
-Djobmanager.memory.process.size=1024m \
-Dexternal-resource.limits.kubernetes.cpu=2000m \
-Dexternal-resource.limits.kubernetes.memory=2Gi \
-Dexternal-resource.requests.kubernetes.cpu=1000m \
-Dexternal-resource.requests.kubernetes.memory=1Gi \
-Dkubernetes.taskmanager.cpu=1 \
-Dkubernetes.jobmanager.replicas=1 \
-Dtaskmanager.numberOfTaskSlots=4 \
-c com.xxx.xxx.xxx \
local:///opt/v2x-1.0-SNAPSHOT.jar

在这里插入图片描述

K8S/Kubernetes

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐

【深度】阿里巴巴万级规模 K8s 集群全局高可用体系之美

作者 | 韩堂、柘远、沉醉来源 | 阿里巴巴云原生公众号前言台湾作家林清玄在接受记者采访的时候，如此评价自己 30 多年写作生涯：“第一个十年我才华横溢，‘贼光闪现’，令周边黯然失色；第二个十年，我终于‘宝光现形’，不再去抢风头，反而与身边的美丽相得益彰；进入第三个十年，繁华落尽见真醇，我进入了‘醇光初现’的阶段，真正体味到了境界之美”。长夜有穷，真水无香。领略过了 K8s“身在江

K8S/Kubernetes

如何基于 K8s 构建下一代 DevOps 平台？

作者 | 孙健波（天元）导读：当前云原生 DevOps 体系现状如何？面临哪些挑战？如何通过 OAM 解决云原生 DevOps 场景下的诸多问题？云原生开发应用模型 OAM(Open Application Model) 社区核心成员孙健波将为大家一一解答，并分享如何基于 OAM 和 Kubernetes 打造无限能力的下一代 DevOps 平台。什么是 DevOps？为什么基于 Kub