logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

GitLab CI + K8s:构建云原生 CI/CD 流水线

本文介绍如何基于GitLabCI+Kubernetes+Helm构建云原生自动化流水线,实现从代码提交到Staging部署的全流程自动化。通过GitOps理念,将YAML/Chart存储在Git仓库作为唯一事实源,结合GitLabCI的stages/jobs机制,实现测试、构建、部署的流水线编排。具体包含代码质量检查、Docker镜像构建推送、Helm部署到K8s等阶段,并集成自动化验证框架确保服

文章图片
#云原生#gitlab#ci/cd
多集群与混合云:云原生的边界突破

摘要: 随着业务规模扩大,单Kubernetes集群在隔离性、灾备和边缘计算等场景中逐渐显现瓶颈。多集群架构成为应对高可用、合规隔离和低延迟需求的必然选择。本文解析多集群核心场景:环境隔离、跨地域灾备和边缘部署,并介绍主流方案——KubeFed实现资源同步、DNS联邦服务发现,以及ArgoCD统一配置管理。同时指出跨集群的网络延迟、证书互信、数据一致性等挑战,建议根据实际需求逐步演进,避免过度设计

文章图片
#云原生#架构
【终结篇】打造一个云原生就绪的 Go 微服务交付平台

本文介绍了一个开箱即用的Go微服务交付平台,整合了CI/CD、可观测性、安全验证等核心能力。平台提供标准化项目结构、自动化流水线(包含测试、构建、部署等阶段)、内置监控(Prometheus指标、OpenTelemetry追踪、结构化日志)、可选Istio流量治理,以及关键的"部署即验证"机制。所有代码以GitHub模板形式开源,开发者可直接fork使用,快速获得生产级微服务交

文章图片
#云原生#golang#微服务
云原生安全:从 Pod 到策略的纵深防御

本文揭示云原生环境常见安全误区,提出从Pod安全到网络策略的全方位防护方案。关键措施包括:强制Pod以非root用户运行并启用只读文件系统,通过NetworkPolicy实现零信任网络,使用Trivy扫描镜像漏洞并签名验证,借助Gatekeeper实施策略即代码,开启Kubernetes审计日志实现操作追溯。文章强调云原生安全需要平台层与应用层协同防护,将最小权限、不可变基础设施等原则贯穿交付全流

文章图片
#云原生#安全
Service Mesh:云原生的流量治理中枢

摘要: ServiceMesh通过Sidecar模式(如Envoy)将微服务治理能力下沉到基础设施层,实现非侵入式的流量管控(熔断、限流、mTLS等),解决了多语言栈统一治理的痛点。其核心价值在于分离应用与平台能力,通过控制平面(如Istio)动态下发策略,但需权衡运维成本与团队规模——适合中大型多语言团队,而小团队可能更倾向SDK方案。关键优势是零代码改造的统一治理,但性能与调试复杂度需额外考量

文章图片
#云原生#service_mesh#架构
微服务架构演进:下一步是 Service Mesh 还是 Serverless?

摘要: 技术架构选择应基于业务需求而非潮流。ServiceMesh适合多语言、强治理场景,但复杂度高;Serverless适用于事件驱动、短时任务,但存在冷启动和厂商锁定问题;模块化单体(Modulith)适合小团队和强耦合业务,部署简单。决策需权衡业务复杂度、团队能力和运维成本,避免盲目追求“先进”。架构演进的终点是找到匹配自身需求的平衡点,而非技术本身的前沿性。

文章图片
#架构#微服务#service_mesh
向量数据库终极对决:Milvus、Pinecone、Weaviate、Qdrant谁才是生产环境的真王者?

本文对比了主流向量数据库Milvus、Pinecone、Weaviate和Qdrant的核心功能、部署模式、性能表现和运维成本。从功能看,Milvus和Qdrant适合强标量过滤,Weaviate和Qdrant适合混合检索。Pinecone为托管服务适合初创团队,Milvus适合大规模K8s部署,Qdrant轻量适合中等规模。性能测试显示Qdrant延迟最低,Milvus吞吐量最高。运维上Milv

文章图片
#数据库#milvus#人工智能 +1
搞懂模型训练与模型推理:AI落地的两个关键阶段

文章摘要:AI系统的模型训练与推理是两大核心环节。训练是让AI"学习"知识的过程,通过大量数据迭代优化模型参数;推理则是应用已训练模型解决实际问题的过程。两者在目标、参数更新、计算复杂度、资源需求等方面存在显著差异:训练计算密集但只需一次,推理要求快速响应且需反复执行。在实际应用中,训练与推理形成闭环系统,通过数据飞轮持续优化模型性能。理解两者的区别与联系,是构建高效AI系统的

文章图片
#人工智能#机器学习#深度学习 +2
LLM基本原理全解析:从预测下一个词到智能对话的奥秘

摘要:大语言模型(LLM)本质上是基于概率预测的文本生成系统,通过Transformer架构的自注意力机制处理语言关系。其训练分为三阶段:预训练掌握语言规律、有监督微调学习对话、人类反馈强化优化回答质量。虽然能完成复杂任务,但存在"幻觉"、知识局限等问题。理解其预测本质而非真实思考,有助于更理性地使用这一工具,发挥其信息处理优势同时规避潜在错误。(149字)

文章图片
#人工智能#语言模型#机器学习
Agent 总失忆?这套记忆架构让它过目不忘!

摘要:本文深入探讨了AI在多轮对话中"失忆"问题的根源与解决方案。指出模型无状态性、Token限制和注意力分散是三大核心问题,并提出分层记忆系统架构:短期记忆(对话缓冲区)、长期记忆(向量检索)、摘要记忆(定期压缩)和结构化记忆(键值存储)。文章详细介绍了三种技术实现方案(滑动窗口+摘要、向量检索、多Agent共享状态)及主流工具生态(LangChain/LlamaIndex等

文章图片
#架构
    共 99 条
  • 1
  • 2
  • 3
  • 10
  • 请选择