logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从单节点到高可用:我是如何一步步搭建生产级K8s集群的

本文分享了在虚拟机上搭建Kubernetes高可用集群的实践过程,包括集群架构设计和部署脚本。集群采用HAProxy+3 Master+2 Node架构,使用containerd运行时和Calico网络插件。文章提供了三个关键脚本:HAProxy部署脚本(修复了启动问题)、K8s环境清理脚本和节点初始化脚本,帮助用户快速搭建生产可用的K8s集群环境。

文章图片
#k8s#云原生#容器
今天看点简单的——OpenAI API

OpenAI API提供多领域AI模型服务,包括文本生成(GPT系列)、代码处理(Codex)、图像生成(DALL·E)和语音识别(Whisper)等。API采用token计费机制,通过角色系统(system/user/assistant)管理对话上下文。在多轮对话中,token数量会随历史记录累积而线性增长,可能导致性能下降和成本上升。建议采用分段存储、内容压缩和动态监控等优化策略,如使用tik

文章图片
RAG(Retrieval-Augmented Generation、检索增强生成)

RAG(检索增强生成)是结合信息检索与生成式AI的技术框架,通过检索外部知识库提升生成内容的准确性。其发展经历了三个阶段:2020年Meta提出的朴素RAG(基于关键词匹配)、2021-2023年的进阶RAG(引入反馈闭环和模块化设计)、以及当前的知识增强与多模态融合阶段(采用知识图谱和智能体决策)。技术实现分为离线索引(文档分块和向量化)和在线生成(检索相关块并生成答案)两大流程,关键优化策略包

文章图片
#人工智能#机器学习#深度学习
LangChain与模型

本文介绍了LangChain支持的主要模型类别和使用方法,包括: 支持的模型类型: OpenAI系列(GPT-4、GPT-3.5等) Anthropic系列(Claude-3等) 开源模型(LLaMA、Mistral等) 云端API模型(Google、Amazon等) 嵌入模型(OpenAI、Hugging Face等) 使用示例: 演示了如何调用OpenAI、Anthropic和开源模型 展示了

文章图片
从PyTorch到Agent:一位中间件工程师的AI技术栈思考

本文探讨了AI技术栈的分层认知模型,从四层到七层架构逐步深入。作者作为中间件工程师,反思了过度聚焦算法模型层(如PyTorch)的局限,强调需要整体把握AI系统架构。重点分析了智能体层(Agent)的核心技术,包括自主决策、环境感知和多智能体协作等能力。同时指出数据层的基础作用和交互层的人机协作价值。最后提出学习路径重构建议:分层突破、经验迁移和实践落地,倡导用系统思维整合中间件经验与AI技术创新

文章图片
#人工智能#架构
大语言模型应用程序框架——LangChain‌

摘要: 大语言模型应用开发框架可分为通用型(如LangChain、Semantic Kernel)、检索增强(如LlamaIndex)、轻量级(如DSPy)和平台服务(如OpenAI API)四类。其中,LangChain作为开源框架,通过模块化设计(Chains/Agents/Memory)支持端到端应用开发,具备工具集成和记忆管理等特性,适用于问答系统、客服机器人等场景。开发者可通过安装配置、

文章图片
#语言模型#人工智能
智能体(Agent)

智能体(Agent)是能自主感知环境、决策并执行任务的AI系统,其核心特征包括自主性、工具调用能力和持续学习能力。与传统AI相比,智能体具备闭环执行、复杂任务拆解和动态调整策略的能力。技术架构包含感知模块(采集环境信息)、决策引擎(大模型驱动推理)和执行单元(调用工具完成操作)。主要类型包括物理智能体(如工业机器人)和虚拟智能体(如ChatGPT)。当前面临认知规划能力不足、环境适应性差等技术挑战

文章图片
#人工智能
LLMops与MLOps

随着AI技术的快速发展,各领域的运维实践不断演进。LLMOps专注于大语言模型全生命周期管理,强调数据可解释性和内容合规性;MLOps则针对传统机器学习模型,注重自动化部署和性能监控。二者在数据管理(质量vs规模)、评估指标(公平性vs准确率)及工具链(NLP专用vs通用ML)等方面存在显著差异。此外,DataOps聚焦数据工程领域,而DevOps则作为基础理念贯穿其中。这些实践共同推动着AI应用

文章图片
#人工智能
大模型评估

文章摘要 大模型评估体系包含多维度标准与方法。评估标准分为通用维度和行业规范:通用维度涵盖基础能力、功能性、使用性能和安全性等;行业规范包括《大模型应用成熟度评估方法》等具体标准。评估方法主要有自动评测(Rule-based和Model-based)和人工评测,前者效率高适合大规模测试,后者准确性优适用于安全敏感场景。评估指标则根据任务类型分为语言模型基础指标、综合能力指标、分类任务指标和多模态指

文章图片
#人工智能
MCP Server + Agent入门示例

本文介绍了MCP(Multi-Channel Protocol)传输模式的三种实现方式及其应用场景。主要内容包括:1)stdio模式(标准输入输出),适用于本地开发,具有低延迟和高安全性;2)Streamable HTTP模式(2025新标准),支持远程部署和复杂网络环境;3)SSE模式(传统兼容),用于维护旧系统。文章提供了代码仓库链接(hello-agent和hello-mcp-server)

文章图片
#DeepSeek
    共 38 条
  • 1
  • 2
  • 3
  • 4
  • 请选择