登录社区云,与社区用户共同成长
邀请您加入社区
本文分享了在虚拟机上搭建Kubernetes高可用集群的实践过程,包括集群架构设计和部署脚本。集群采用HAProxy+3 Master+2 Node架构,使用containerd运行时和Calico网络插件。文章提供了三个关键脚本:HAProxy部署脚本(修复了启动问题)、K8s环境清理脚本和节点初始化脚本,帮助用户快速搭建生产可用的K8s集群环境。
本文详细介绍了Kubernetes单节点集群的部署流程,包含以下核心步骤: 基础环境配置:关闭防火墙和交换分区,设置内核参数和主机名 容器运行时配置:使用containerd作为K8s运行时,配置国内镜像源 K8s组件安装:通过阿里云源安装kubeadm、kubelet和kubectl 集群初始化:指定内网IP和国内镜像源,配置Calico网络插件 私有仓库对接:配置Harbor证书并创建访问凭证
本文介绍了Kubernetes中Pod的生命周期管理,主要包括Pod的创建和终止过程、5种状态(Pending、Running、Succeeded、Failed、Unknown)以及初始化容器的作用。
2026年2月11日,Kubernetes发布了最新v1.35.1版本。截至2月11日,本实验相关软件etcd、docker、cri-dockerd、nginx、kubectl-ai及清单文件calico、coredns、metrics server均采用最新发布版本。集群部署中,发现了个别配置参数过期在本次版本中不能再使用而需要调整,新版k8s体系在部署方面仍维持了高度的稳定性和一到性。本方案结
【代码】【云原生】Gateway API高级功能。
可观测性是云原生系统稳定运行的关键能力,通过指标、日志、链路追踪三支柱联动,实现系统状态的全面监控。文章解析了可观测性技术栈的四大环节:数据采集层(Prometheus、Fluentd等工具)、存储层(时序数据库、Elasticsearch等)、分析可视化层(Grafana、Kibana等)和告警响应层(Alertmanager等)。针对Kubernetes环境,详细介绍了Prometheus+G
设置指定的node为不可用# 查看node状态kubectl get nodes# 将node标记为不可调度状态kubectl cordon node名# drain清空node## --delete-local-data 清空本地数据## --ignore-daemonsets 忽略daemonsets错误## --force 强制执行kubectl drain node名 --delete-l
k8s的隔离和驱逐
本文主要介绍了Kubernetes中的网络方案CNI(Container Network Interface)及其实现Flannel和Calico。CNI是容器网络接口规范,为Kubernetes提供通用网络标准。Flannel通过VXLAN、host-gw和UDP三种模式实现跨节点Pod通信,支持DirectRouting优化性能。Calico则采用BGP路由协议或IPIP/VXLAN隧道,提供
本文梳理了容器技术从Docker到K8s的演进历程,重点解析OCI与CRI两大标准体系的关系。早期Docker垄断市场,K8s被动适配其私有API;2015年Docker推动OCI标准化,捐赠libcontainer形成runc;2016年Docker拆分出containerd模块;2017年K8s推出CRI接口标准,同时Docker将containerd捐赠给CNCF,实现中立化。最终K8s 1
如图,当服务器重启之后,常常创建 pod就会报这样的错误。重启一下网络插件就可以了。
Kubernetes Pod Pending状态排查指南 摘要:Pod长时间处于Pending状态是Kubernetes运维常见问题。本文系统性地分析了Pending状态的排查思路:首先通过kubectl describe pod查看Events和Node分配情况,判断是否调度成功。调度失败可能由资源不足(CPU/Memory)、requests设置过大、NodeSelector不匹配、Taint
首先,为名为 rancher.io/local-path 的现有制备器,创建一个名为 ran-local-path 的新 StorageClass。注意,没有设置卷绑定模式,或者将其设置为 WaitForFirstConsumer 之外的其他任何模式,都将导致分数降低。接下来,将 ran-local-path StorageClass 配置为默认的 StorageClass。1、创建一个名为ran
本文旨在用尽可能直白的语言对昇腾的MindX DL的集群调度组件做一个简单非官方的介绍,如有疑问欢迎留言讨论~!这是第一期(完事开头难,中间难,最后也难…)
你现在拥有一个完全手搓、无 TLS、基于 ubuntu:22.04、Ingress 暴露、WebSocket 连接、主从分离的 Jenkins CI/CD 系统。特性实现方式Master 镜像自定义 ubuntu:22.04Agent 镜像自定义 ubuntu:22.04 + remoting.jar存储暴露方式主从连接WebSocket(无需 50000 端口)Pod 名权限SA + RBAC可
本文介绍了Kubernetes中的存储机制,重点讲解了emptyDir、hostPath、nfs、persistentVolumeClaim、configMap和secret这六类常见的存储方式。并针对每种存储方式给出了运行示例。
MCP(Model Context Protocol)是由 Anthropic 推出的一种开放标准,旨在为大型语言模型(LLMs)提供与外部数据源和工具交互的标准化接口。下方架构图形象地指出了 MCP 的主要组成部分:MCP Host:发起请求的 LLM 应用程序,比如 Claude、IDEMCP Client:与 MCP Server 建立1:1连接,处理通信MCP Server:为 MCP c
本文详细介绍了在Kubernetes集群中部署ELFK(Elasticsearch、Logstash、Filebeat、Kibana)日志系统的实验过程。实验内容包括:1)部署3节点Elasticsearch集群并配置X-Pack安全认证;2)部署Kibana可视化平台;3)配置Logstash日志处理管道;4)部署Nginx和Tomcat应用,并使用Filebeat作为Sidecar容器收集日志
Kubernetes的Service提供了基本的轮询负载均衡,而Istio通过自定义资源定义(CRD)如 VirtualService和 DestinationRule,让你能实现基于权重的流量拆分(金丝雀发布)、故障注入、重试、超时、熔断等极其复杂的流量治理策略。Istio 是一个开源的服务网格(Service Mesh)平台,它透明地集成到分布式应用中,为微服务架构提供统一的连接、安全、控制和
然后查阅相关资料后发现,应该是人误操作点了trial试用版。trial试用版仅提供30天的使用权限,在试用期内提供所有高级功能,试用结束后需要购买正式许可证。删除后重启kibana服务,kibana就会自动重新创建。开启basic license(ES如没启用认证则删除。再次查看集群的许可证信息,type已变为basic。索引了,kibana界面也能正常访问。
Elastic Cloudon Kubernetes(ECK)是Elastic官方提供的Kubernetes Operator,用于简化在Kubernetes环境中部署、管理和扩展Elastic Stack的全方位组件。ECK基于Kubernetes的Custom Resource Definitions(CRDs),可以让用户以声明式的方式定义和管理Elastic Stack组件,比如创建一个E
项目描述:我们将探讨如何通过虚拟机中集群化部署的 centos系统来控制海康摄像机,并利用 OpenCV 实现基础的视频流处理。整个过程的实现,主要参考了海康的 API 文档,目标是通过虚拟机有效控制监控设备并进行视频数据的处理。博文描述:博文还将介绍如何在虚拟机中配置双网络环境,使得系统同时能够访问内网和公网。这一技术方案对于其他类似项目也具有很高的借鉴意义,特别是在需要同时进行公网和内网资源访
Kubernetes系统配置与管理指南 摘要: 本文全面介绍了Kubernetes容器编排系统的部署、配置与管理方法。主要内容包括: 基础架构 集群组成:Master节点(API Server、Scheduler等)和Worker节点(kubelet、kube-proxy等) 网络模型:CNI插件原理及Flannel/Calico实现方案 存储方案:PV/PVC机制和StorageClass动态供
出现报错:Detected non-NVML platform: could not load NVML library: libnvidia-ml.so.1: cannot open。也能看到卡,就是用helm装device-plugin的时候报这个错,搞不懂,后来发现只需要重新再执行一次。但是看docker的运行时已经改为了nvidia-container-runtime,而且。
Rancher 2.6 监控启用方式与之前版本存在较大差异,属于原生的 Prometheus-Operator,通过抽象化一些 Kubernetes CRD 资源,可以更好地把监控告警功能整合起来,提高易用性。
Kubernetes中的节点污点(Taint)和容忍度(Toleration)机制用于控制Pod调度。污点是节点属性,用于排斥不匹配的Pod;容忍度是Pod属性,允许Pod调度到带污点的节点。污点参数包括键、操作符(Equal/Exists)、值和效果(NoSchedule/PreferNoSchedule/NoExecute)。NoExecute污点会驱逐未容忍的Pod,而NoSchedule仅
云原生一周动态要闻:Apache Log4j 2.17.1 修复远程代码执行漏洞CNCF 发布 2021 年度报告极狐(GitLab)发布业内首款“GitNative” DevOps 云一体化解决方案JetBrains 发布了带有新的远程开发功能的 IntelliJ IDEA 2021.3开源项目推荐文章推荐Grafana Loki 是一个优秀的轻量级日志监控平台,该项目受 Prometheus
定义:PVC 是用户对存储资源的“申请书”。解耦:开发者只需声明容量和访问模式,无需关心底层存储硬件。动态性:配合,系统可自动在 LVM 卷组中切分物理空间并绑定。标准化:纯 CLI 操作极大降低了人为误操作的概率,且所有操作均可编写为自动化脚本。网络闭环:理解 Service 到 Route 的端口映射关系是部署复杂有状态应用的关键。高性能:LVM 动态存储提供了原生磁盘级的 I/O 效率,完美
本文详细介绍了从零开始搭建Kubernetes集群的全过程。首先在VMware Workstation上创建3台Ubuntu 20.04虚拟机(1主2从),配置静态IP、SSH等基础环境。然后依次安装Docker CE、CRI-Docker和Kubernetes组件,手动完成集群初始化与节点加入。最后通过Ansible自动化脚本实现一键部署,包括配置国内镜像源、安装依赖组件、初始化集群等完整流程。
望宸,阿里云高级技术运营专家,专注于微服务与云原生技术。探讨网关技术从传统到云原生的演进历程,结合 AI 驱动的现代化实践,实现智能化流量管控和高效数据流转。张连壮,青云科技高级研发工程师,专注于云计算与分布式系统设计,深耕 Kubernetes 上的 GPU 算力资源调度优化。通过 HAMI 平台,展示 Luban 架构如何整合云原生与 AI 能力,助力企业实现智能化计算资源的优化与调度。张晓辉
启用后,kubelet 会直接从容器运行时(CRI,即 containerd)获取容器/Pod 的统计数据,而非依赖内置的 cadvisor,这会导致 cadvisor 虽然仍在运行,但可能不再主动收集容器指标(因为 kubelet 已通过 CRI 拿到数据,无需 cadvisor 重复工作),通常的表现是执行。Metrics Server 是 Kubernetes 集群中用于收集和聚合节点、Po
在云原生架构下,中间件管理方式和传统方式有较大差别。首先在 K8s 上如何管理中间件集群,其次云原生架构将运维能力下沉,如何高效利用云原生能力并实现中间件跨可用区高可用?在 10 月 18-19 日举办的 QCon 全球软件开发大会上,网易云信资深架构师裴明明为我们带来了精彩的专题演讲“云原生架构下中间件联邦高可用架构实践”,重点介绍了网易云信基于 K8s 的集群联邦能力实现中间件有状态应用跨可用
前提:app 110机器构建 OCI 镜像的ACR地址:crpi-ua3er91ww0y2dq1i.cn-shenzhen.personal.cr.aliyuncs.com/mirrors-yuan/flask-forum:1.0ctr(全称:containerd CLI)是 containerd 自带的命令行工具,用于拉镜像、跑容器等清理旧容器(如果存在)c 确认容器是否正常2、在 app 机器
nvidia.com/mig-1g.5gb: "1" # 精确请求一个 1g.5gb 规格的 MIG 实例。aliyun.com/gpu-mem: "4" # 请求 4GiB 的显存配额和相应的算力时间片。nvidia.com/gpu: "1" # < 请求 1 个 GPU。下面我们看看在不同的技术方案下,nvidia.com/gpu: "1" # < 限制也必须是 1。nvidia.com/mi
国产算力的兴起,异构算力成为各大厂商的选择,以摆脱对英伟达算力过大的依赖,保障算力安全。1、在宿主机上安装,在容器内进行引用,但这样会依赖于宿主机,对于k8s集群来说,每台机器上都要安装这些环境,好处是juputer-arm镜像体积较小;发现无法使用torch_npu,转到容器内安装torch_npu,注意torch_npu要和torch的版本保持一致。2、在jupter容器中安装,这样容器独立,
Pod 遵循预定义的生命周期,起始于Pending阶段, 如果至少其中有一个主要容器正常启动,则进入Running,之后取决于 Pod 中是否有容器以失败状态结束而进入Succeeded或者Failed阶段。与此同时 Pod 在其生命周期中只会被调度一次。一旦 Pod 被调度(分派)到某个节点,Pod 会一直在该节点运行,直到 Pod 停止或者被终止。
在移动互联网与多端融合的时代背景下,跨平台开发框架已成为提升效率、降低成本的关键技术。DCloud推出的UniApp凭借“一套代码,多端发布”的理念,吸引了数百万开发者。然而,随着应用复杂度提升和对原生性能的极致追求,传统的WebView混合架构逐渐触及天花板。为此,DCloud推出了被称为“下一代UniApp”的。
本文分享了在 openEuler 22.03 LTS SP3 操作系统上,如何利用 KubeSphere 开发的工具KubeKey,部署集群的详细流程及注意事项。openEuler 22.03 LTS SP3 操作系统基础配置openEuler 22.03 LTS SP3 操作系统上 LVM 磁盘的创建配置使用 KubeKey 部署 K8s 高可用集群K8s 集群部署完成后的验证测试笔者水平有限,
【代码】基于docker安装-高斯DB(opengauss)
昨天,没错,是昨天。凌晨(12-25 00:00)要在生产预发版,根据之前交接的模块部署文档准备了一天的环境(也是第一次),结果快下班的时候,在处理一个问题时才发现 K8s 上 OceanBase CE 实例一直是挂的(服务太多了,眼睛都花了)。偏偏是和测试环境完全相同的配置及规格,却一直启动失败。翻遍了 OceanBase 问答社区,排查了很久,尝试了很多解决方案,最终解决了,特此记录下解决方案
k8s
——k8s
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net