logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于 vLLM 和 SGLang 的模型推理服务架构

本文提出了一种结合vLLM和SGLang的LLM推理服务架构。vLLM通过PagedAttention等技术实现高性能推理,提供高吞吐低延迟;SGLang则提供结构化生成能力,支持约束解码和多轮对话管理。架构采用分层设计:SGLang运行时负责解析结构化请求、约束编译和负载均衡,vLLM引擎执行高效推理。支持单机或集群部署,通过缓存和并行技术优化性能。该架构兼具vLLM的高性能和SGLang的灵活

#sglang#架构
Web3资产交易系统冷启动实战:如何快速获取第一批种子用户

Web3资产交易系统的第一批种子用户,从来不是“等着自然出现”的,而是通过精准的定位、有效的叙事、合理的激励和深度的社区运营“主动跑出来”的。2026年的加密市场,机会与挑战并存。行业已从“讲故事”回归到“做增长”的务实阶段,重心聚焦用户获取与留存,Web2的高效获客策略也开始重新具备合理性。对于Web3创业团队而言,谁能在冷启动阶段跑通一套可复制的增长模型,谁就更有可能在下一轮浪潮中占据先机。您

#web3
Claude Code源码深度解析:当51万行代码敞开,我们看到了什么?

2026年3月,Anthropic旗下AI编程工具ClaudeCode因npm包中的sourcemap文件泄露51万行TypeScript源码。分析显示其采用六层架构设计,包括入口层、展示层(基于React+Ink)、核心引擎层(46K行QueryEngine)、执行层(30+工具)、协作层(多Agent系统)和管理层。系统亮点包括:启动优化(并行预取缩短135ms)、BUDDY宠物系统(确定性生

#AIGC
Cursor + OpenSpec 开发工作流:从Vibe Coding到Spec-Driven Development的工程实践

AI编程时代的规范驱动开发:OpenSpec框架解析 摘要:随着AI编程助手能力的提升,"凭感觉编程"(VibeCoding)模式暴露出需求偏移、追溯困难等痛点。OpenSpec框架通过规范驱动开发(SDD)解决这些问题,将AI编程转变为可预测的工程模式。该框架采用"提案-审查-实施-归档"四阶段工作流,分离稳定规范(specs/)与变更提案(changes

#数据结构
Claude & Codex Skills 完整实战指南

本文系统介绍了Claude和Codex/Copilot两大AI编程工具的特性差异与协同使用方法。第一部分对比了两者的核心优势:Claude擅长需求分析、架构设计等宏观任务,支持超长上下文;Copilot则专注于实时代码补全。第二部分详细讲解了环境配置与基础操作技巧。第三部分提供了双工具协同工作流方案,包括从需求分析到部署的全流程实战演示。文章还包含高级提示工程技巧、常见问题解决方案以及实用Prom

#人工智能
Clawdbot (OpenClaw): 架构与实现解析

了解Clawd的内部工作机制,能让我们更好地理解这个系统及其能力,最重要的是,明白它擅长什么与不擅长什么。这一切始于我个人对Clawd如何处理记忆及其可靠性的好奇。在本文中,我将浅析Clawd的工作方式。Clawd的技术实质众所周知,Clawd是一个个人助理,你可以本地运行或通过模型API使用,并能像在手机上一样轻松访问。但它究竟是什么?本质上,Clawdbot 是一个 TypeScript CL

文章图片
#架构#人工智能
基于 vLLM 和 SGLang 的模型推理服务架构

本文提出了一种结合vLLM和SGLang的LLM推理服务架构。vLLM通过PagedAttention等技术实现高性能推理,提供高吞吐低延迟;SGLang则提供结构化生成能力,支持约束解码和多轮对话管理。架构采用分层设计:SGLang运行时负责解析结构化请求、约束编译和负载均衡,vLLM引擎执行高效推理。支持单机或集群部署,通过缓存和并行技术优化性能。该架构兼具vLLM的高性能和SGLang的灵活

#sglang#架构
解决之前连接 api.anthropic.com 失败的问题

本文介绍了ClaudeCode在Windows系统中的配置文件体系,分为用户级和项目级两类。用户级配置包括全局设置、本地覆盖、全局指令、MCP服务器和凭证文件,存储在用户目录下;项目级配置包含共享设置、本地设置、项目指令和MCP配置,位于项目根目录。配置加载遵循从全局到项目、从共享到本地的优先级顺序。文章还针对API连接失败问题提供了排查建议,包括联系服务商获取准确信息、检查API密钥格式、尝试通

文章图片
#人工智能
从Vibe Coding到Spec Coding:OpenSpec规范驱动开发指南

摘要:OpenSpec框架推动AI编程从"凭感觉聊天"转向"规范驱动开发",通过结构化四阶段工作流提升代码质量。该框架要求先创建机器可读规范作为"真相来源",再实施开发,包含起草提案、审查对齐、AI实施和归档四个步骤。OpenSpec提供标准化目录结构和规范格式,支持自然语言指令与AI协作,同时确保需求可追踪、变更可审计。典型应用场景如添

文章图片
#驱动开发#人工智能
springcloud集成skywalking实现全链路追踪

本文详细介绍了如何在SpringCloud微服务架构中集成SkyWalking实现全链路追踪。SkyWalking通过无侵入探针技术自动绘制服务调用拓扑,还原请求完整路径,帮助快速定位性能瓶颈。文章从核心原理、服务端部署(基于Docker和Elasticsearch)、客户端接入(JavaAgent配置)、网关插件启用等方面展开说明,并介绍了服务拓扑图、调用链追踪等核心功能。同时提供了自定义埋点、

#spring cloud#skywalking#spring
    共 52 条
  • 1
  • 2
  • 3
  • 6
  • 请选择