xin.cheng 个人主页

@weixin_41120248

xin.cheng

2023-07-20 23:17:36 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

从单节点到高可用：我是如何一步步搭建生产级K8s集群的

本文分享了在虚拟机上搭建Kubernetes高可用集群的实践过程，包括集群架构设计和部署脚本。集群采用HAProxy+3 Master+2 Node架构，使用containerd运行时和Calico网络插件。文章提供了三个关键脚本：HAProxy部署脚本（修复了启动问题）、K8s环境清理脚本和节点初始化脚本，帮助用户快速搭建生产可用的K8s集群环境。

#k8s #云原生 #容器

今天看点简单的——OpenAI API

OpenAI API提供多领域AI模型服务，包括文本生成(GPT系列)、代码处理(Codex)、图像生成(DALL·E)和语音识别(Whisper)等。API采用token计费机制，通过角色系统(system/user/assistant)管理对话上下文。在多轮对话中，token数量会随历史记录累积而线性增长，可能导致性能下降和成本上升。建议采用分段存储、内容压缩和动态监控等优化策略，如使用tik

RAG（Retrieval-Augmented Generation、检索增强生成）

RAG（检索增强生成）是结合信息检索与生成式AI的技术框架，通过检索外部知识库提升生成内容的准确性。其发展经历了三个阶段：2020年Meta提出的朴素RAG（基于关键词匹配）、2021-2023年的进阶RAG（引入反馈闭环和模块化设计）、以及当前的知识增强与多模态融合阶段（采用知识图谱和智能体决策）。技术实现分为离线索引（文档分块和向量化）和在线生成（检索相关块并生成答案）两大流程，关键优化策略包

#人工智能 #机器学习 #深度学习

LangChain与模型

本文介绍了LangChain支持的主要模型类别和使用方法，包括：支持的模型类型： OpenAI系列（GPT-4、GPT-3.5等） Anthropic系列（Claude-3等）开源模型（LLaMA、Mistral等）云端API模型（Google、Amazon等）嵌入模型（OpenAI、Hugging Face等）使用示例：演示了如何调用OpenAI、Anthropic和开源模型展示了

从PyTorch到Agent：一位中间件工程师的AI技术栈思考

本文探讨了AI技术栈的分层认知模型，从四层到七层架构逐步深入。作者作为中间件工程师，反思了过度聚焦算法模型层（如PyTorch）的局限，强调需要整体把握AI系统架构。重点分析了智能体层（Agent）的核心技术，包括自主决策、环境感知和多智能体协作等能力。同时指出数据层的基础作用和交互层的人机协作价值。最后提出学习路径重构建议：分层突破、经验迁移和实践落地，倡导用系统思维整合中间件经验与AI技术创新

#人工智能 #架构

大语言模型应用程序框架——LangChain‌

摘要：大语言模型应用开发框架可分为通用型（如LangChain、Semantic Kernel）、检索增强（如LlamaIndex）、轻量级（如DSPy）和平台服务（如OpenAI API）四类。其中，LangChain作为开源框架，通过模块化设计（Chains/Agents/Memory）支持端到端应用开发，具备工具集成和记忆管理等特性，适用于问答系统、客服机器人等场景。开发者可通过安装配置、

#语言模型 #人工智能

智能体（Agent）

智能体（Agent）是能自主感知环境、决策并执行任务的AI系统，其核心特征包括自主性、工具调用能力和持续学习能力。与传统AI相比，智能体具备闭环执行、复杂任务拆解和动态调整策略的能力。技术架构包含感知模块（采集环境信息）、决策引擎（大模型驱动推理）和执行单元（调用工具完成操作）。主要类型包括物理智能体（如工业机器人）和虚拟智能体（如ChatGPT）。当前面临认知规划能力不足、环境适应性差等技术挑战

#人工智能

LLMops与MLOps

随着AI技术的快速发展，各领域的运维实践不断演进。LLMOps专注于大语言模型全生命周期管理，强调数据可解释性和内容合规性；MLOps则针对传统机器学习模型，注重自动化部署和性能监控。二者在数据管理（质量vs规模）、评估指标（公平性vs准确率）及工具链（NLP专用vs通用ML）等方面存在显著差异。此外，DataOps聚焦数据工程领域，而DevOps则作为基础理念贯穿其中。这些实践共同推动着AI应用

#人工智能

大模型评估

文章摘要大模型评估体系包含多维度标准与方法。评估标准分为通用维度和行业规范：通用维度涵盖基础能力、功能性、使用性能和安全性等；行业规范包括《大模型应用成熟度评估方法》等具体标准。评估方法主要有自动评测（Rule-based和Model-based）和人工评测，前者效率高适合大规模测试，后者准确性优适用于安全敏感场景。评估指标则根据任务类型分为语言模型基础指标、综合能力指标、分类任务指标和多模态指

#人工智能

MCP Server + Agent入门示例

本文介绍了MCP（Multi-Channel Protocol）传输模式的三种实现方式及其应用场景。主要内容包括：1）stdio模式（标准输入输出），适用于本地开发，具有低延迟和高安全性；2）Streamable HTTP模式（2025新标准），支持远程部署和复杂网络环境；3）SSE模式（传统兼容），用于维护旧系统。文章提供了代码仓库链接（hello-agent和hello-mcp-server）

#DeepSeek

共 38 条

请选择