登录社区云,与社区用户共同成长
邀请您加入社区
本质:是 k8s 集群中预先创建的存储资源,由运维人员配置,属于集群级资源(不隶属于任何 Namespace)。作用:将底层存储(如本地磁盘、NFS、Ceph、云厂商的云盘等)抽象成 k8s 可管理的资源对象,提供标准化的存储接口。关键属性存储类型(storageClassName):用于和 PVC 绑定的核心标识,支持动态供应存储。容量(capacity):声明存储的大小,如10Gi。访问模式(
在大模型与深度学习应用爆发的背景下,GPU 不再是实验室的加速卡,而是核心计算力。在这一趋势下,传统 GPU 云架构渐显短板:虚机绑定 GPU 粒度粗、资源浪费大与 Kubernetes 原生生态割裂弹性调度与混合负载调度能力不足为了让 GPU 资源真正成为云原生的平台级计算资源,我们在自主设计并落地了一套,本文将系统性地介绍其设计理念、核心组件与工程实现细节,帮助读者了解如何构建可观测、可调度、
Pod是Kubernetes中最小的可部署和管理单元。一个Pod包含一个或多个紧密相关的容器(可以把Pod看作一个逻辑上的容器组),这些容器共享:Container RuntimekubeletScheduleretcdAPI ServerUser(kubectl)Container RuntimekubeletScheduleretcdAPI ServerUser(kubectl)#mermai
本文详细介绍了RustFS分布式存储系统的核心优势与部署方案。RustFS凭借其轻量级设计(<100MB)、高性能(比MinIO快40%+)、S3协议兼容等特性,成为云原生环境下的理想存储选择。文章提供了从Docker单节点快速部署到Kubernetes生产级集群搭建的完整流程,包含环境准备、Helm图表配置、资源配额设置等关键步骤。同时分享了性能优化建议(SSD存储、线程池调优)、安全实践(TL
k8s 分布式存储平台 -- Longhorn。介绍了分布式块存储平台 Longhorn 的安装、部署、UI 配置、使用、功能展示等
在使用异构计算服务的场景中,“计算资源过剩”问题十分普遍。以云游戏为例,企业通常仅需要一颗物理GPU几分之一的计算能力即可流畅完成图形或视觉计算。针对这类对算力需求较少的应用场景,轻量型...
蓝耘元生代平台通过ComfyUI工作流+企业级技术文档+行业领先算力的三位一体架构,正在重塑AI开发的效率边界。其核心价值不仅在于技术创新,更在于构建了一个开放、协作的生态系统,让开发者从繁琐的基础设施中解放出来,专注于创意与业务落地。随着元宇宙与AIGC的爆发,蓝耘元生代将成为连接技术理想与产业现实的桥梁,推动AI开发进入“全民算力”的新纪元。
Kubernetes资源YAML配置文件遵循统一结构,包含必填字段apiVersion(指定API组/版本)、kind(资源类型)、metadata(资源元数据)和spec(定义期望状态)。不同资源类型的spec结构各异,但顶层框架保持一致,包括自定义资源(CRD)。status字段由系统自动维护。可通过kubectl explain或导出现有资源查看具体结构。该标准化设计体现了Kubernete
2025年Kubernetes已进入成熟稳定期,核心API几乎不再变动,升级风险显著降低。平台工程从过度封装转向简化,更多企业采用托管服务。在AI领域,K8s主要承担资源管理和作业调度角色,而非解决核心算力问题。多集群成为常态,治理工具趋于标准化。YAML问题未被彻底解决但被接受,团队更注重API边界控制。Kubernetes已从创新平台转变为基础设施,强调稳定性而非功能突破,完成了从"
本文探讨了在不修改业务层Nginx配置的情况下,如何通过Envoy劫持业务流量。文章分析了两种解决方案:1) 通过hostAliases修改域名映射,将流量指向Envoy;2) 使用iptables规则拦截特定流量并重定向到Envoy。重点阐述了iptables方案的具体实现,包括规则配置、用户隔离等细节,并提出了通过initContainers自动配置iptables的工程方案。文章指出该方法实
摘要:Open-Local云原生本地存储解决方案 Open-Local是阿里云开源的Kubernetes本地存储管理系统,旨在解决云原生环境下有状态应用对高性能存储的需求。该系统通过LVM和裸设备两种方式管理本地磁盘,提供动态分配、扩容、快照等企业级存储功能。Open-Local包含四大组件:调度扩展器(Scheduler-Extender)、CSI插件、节点代理(Agent)和控制管理器(Con
SSL Passthrough 是TCP 层透传,依赖SSL/TLS 握手阶段的 SNI 字段(携带 Ingress 配置的host域名)触发,与 HTTP 层的 Host 头无关。直接访问节点 IP(172.16.80.16)时,SNI 携带 IP 而非配置域名,导致透传失效,请求被 Ingress Controller 自身处理。注解仅用于非透传场景(Ingress Controller 解密
在 Kubernetes 中,Deployment是一种声明式的 API 资源,它允许开发者描述应用的期望状态,并且 Kubernetes 会确保这个期望状态得以实现。一个Deployment可以管理多个副本的 Pod,提供高可用性、负载均衡和滚动更新等功能。"Deployment does not have minimum availability" 错误通常是因为Deployment中定义的
本文系统阐述端到端测试中构建可靠用户旅程验证体系的方法。核心要点包括:1)用户旅程验证的重要性,能识别跨模块缺陷、提升用户体验和测试效率;2)关键实施策略,如需求分析、自动化框架设计(推荐Cypress/Selenium)、持续集成和监控优化;3)成功案例显示AI工具和模块化设计可显著提升验证可靠性。文章指出未来趋势将向AI驱动测试和无代码工具发展,强调持续学习新技术对测试质量提升的关键作用。
很久之前就想写这个教程,但怕过于简单,而且站内leaflow教程挺多的,但是今天又看见群内有佬友部署openlist遇到权限的问题,所以写下了这个话题。-----------------------------手动分割线-------------------------------------如下图,先创建一个存储卷,存储不贵,设大一点也没关系(这个存储卷我后来扩容了,所以和后面挂载图中的128M
《Kurator:下一代分布式应用分发平台的核心理念与技术突破》 本文探讨了在混合多云和边缘计算时代,传统应用分发模式面临的四大核心痛点:工具链碎片化、环境一致性危机、网络传输瓶颈和运维能见度缺失。Kurator作为新一代分布式应用分发平台,通过三大核心理念实现技术突破:1)统一抽象,通过Distribution CRD封装应用分发全流程;2)智能P2P调度,利用Dragonfly等技术实现高效协
在云原生时代,IaaS、PaaS、Serverless 各种名词层出不穷,很多开发者只会用却不懂背后的架构演进。本文拒绝枯燥的概念堆砌,通过“租房”、“点餐”等通俗易懂的生活案例,结合高清架构图,带你一文彻底搞懂从 Docker 到 K8s 的底层逻辑与选型策略。面试、架构选型必读!
Pod调度到节点后,AD控制器创建VolumeAttachment对象,External Attacher调用CSI插件挂接存储卷,完成后更新状态。:用户创建PVC,K8s根据PVC和StorageClass,让External Provisioner调用CSI插件创盘,之后创建PV并绑定PVC。:Kubelet发现使用CSI类型PV的Pod调度到本节点,等待VolumeAttachment状态就
ES跨集群数据迁移方案(本地磁盘版)
三级缓存架构是一种通过分层缓存设计来优化系统性能、降低数据库负载、提高数据访问效率的解决方案,尤其适用于高并发、高吞吐量的业务场景(如电商、社交平台、实时推荐等)。其核心思想是通过多级缓存逐层过滤请求,减少对底层存储的直接访问。三级缓存架构通过分层设计平衡性能、一致性与复杂度,是应对高并发场景的经典方案。实际应用中需结合业务特点灵活调整各级缓存策略,并辅以监控工具(如Prometheus + Gr
本文介绍了Kubernetes 调度系统的内部机制,并成功构建、部署了一个自定义的 Scheduler 插件。然后采用nginx完整示例演示自定义Scheduler 插件如何发挥作用的
ragflow官方提供的安装方式是docker-compose方式部署的,单机运行。k8s部署方式,暂未提供。不过我们可以通过工具,结合docker-compose.yaml,来推演出对应服务的yaml进行部署。过程有点曲折,结果很美好。接下来,本文将使用ragflow-0.18.0,来进行演示详细部署过程。
Argo Workflows是基于Kubernetes的开源工作流引擎,专为编排并行作业设计。它通过DAG或顺序步骤定义复杂任务,每个步骤在独立Pod中运行。作为CNCF孵化项目,Argo具备原生Kubernetes集成、容器即任务理念、强大并行处理能力等优势,支持参数传递、制品管理、条件执行等高级功能。安装简单,适用于数据处理管道、机器学习工作流、CI/CD等多种场景。通过YAML定义工作流,A
虽然在tool定义中都有描述,但是对比了其他的一些模型和mcp server的交互,总是不尽人意,要不就是给的参数json格式错误,要不就是理解错了参数需要传入的信息。复杂的架构、繁多的概念、以及那些需要记忆的kubectl命令...,现在有了MCP可以让这种交互变得更加简单,尝试通过AI自然语言对话来完成对k8s集群各种资源的操作乃至于定于集群的问题。做这个项目的过程中,最大的感受就是:技术发展
本文面向开发者与产品经理,深度解析ChatGPT-4o API全链路应用场景。从基础对话接口调用到自动化代码生成系统搭建,涵盖角色扮演、函数调用、多模态处理等高级功能。通过电商客服、智能编程助手、数据分析报告生成三大实战案例,结合Postman调试与Python SDK实现,揭示API使用中的15个关键陷阱及规避方案,助您将开发效率提升400%。
1)Nacos里的服务要提前下线 2)K8s探针要合理配置,不然就会出现还没完全关,Pod已经被砍了 3)业务线程池、连接池、消息队列等资源得主动回收 4)一些长连接(WebSocket、Grpc、TCP)要主动关闭 5)如果有MQ消费者,还要搞定幂等性 + 消息回补机制。SpringBoot + Nacos + K8s 想做到“真·优雅停机”,不能只靠“系统自动”,而是要你作为开发者主动插手,去
本文全面解析Kubernetes持久化存储方案,涵盖五种常用存储类型:emptyDir作为临时存储随Pod生命周期存在;hostPath实现节点本地存储但存在单点故障;NFS网络文件系统支持多节点访问;PVC/PV机制解耦存储供应与使用;StorageClass实现动态PV创建。文章详细介绍了每种方案的特点、适用场景及具体配置方法,帮助用户根据实际需求选择最合适的持久化存储方案,确保应用数据的可靠
本文探讨在Kubernetes上部署Elasticsearch的最佳实践,解决有状态应用容器化的核心挑战。通过角色分离架构设计,建议使用独立的StatefulSet部署主节点和数据节点,Deployment部署协调节点和接收节点。重点解决持久化存储问题,推荐本地SSD或高性能云盘,并给出AWS EBS StorageClass配置示例。文章包含架构图、YAML片段和注意事项,帮助构建高可用、高性能
如果你忘了sysdba的密码,自己搜重置密码的命令注意上面的ORCL是oracle实例的名字, 也可能为xe, 需要具体查看你的oracle版本,具体的命令可以问豆包。
异步处理:非核心流程(如日志打印、通知推送)用 @Async + 自定义线程池(避免默认线程池耗尽),释放主线程,提升接口响应速度;ORM 优化:MyBatis 禁用一级缓存(local-cache-scope=STATEMENT,避免分布式环境脏数据)、开启二级缓存(合理场景)、减少关联查询(必要时手动分查,避免 join 过多)。堆内存:-Xms4g -Xmx4g(初始 / 最大堆一致,避免堆
摘要:K8s GPU资源优化四大技巧提升AI推理效率 本文针对AI推理场景中GPU利用率低下的问题,提出了一套完整的K8s GPU优化方案。通过分析某智能客服平台面临的GPU成本危机(128张A10G GPU利用率仅28%),团队实施"四维优化策略": MIG切分:将物理GPU划分为多个独立实例 Triton动态批处理:合并小请求提升吞吐 GPU时间切片共享:允许多个Pod共享
本文详细介绍了Kubernetes集群的安装配置流程,主要包括:1)基础环境准备(Ubuntu系统配置、关闭swap、内核参数设置);2)容器运行时containerd的安装与systemd cgroups配置;3)Kubernetes组件(kubeadm/kubelet/kubectl)的安装;4)Master节点初始化过程中的常见问题解决方案(镜像拉取、pause版本不一致等);5)网络插件F
MCP (Model Control Protocol)是一种协议,允许LLM与外部工具进行结构化交互。获取可用工具及其参数列表调用这些工具执行操作获取操作结果并基于结果继续交互这使得LLM能够"控制"外部系统,执行从查询数据库到操作Kubernetes资源等各种任务。mcp-go工具注册和管理协议消息处理多种传输方式支持(stdio、HTTP SSE等)使用mcp-go,我们可以快速构建自己的M
kubernetes
——kubernetes
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net