logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLM - 从 Prompt 到 Skills

2025年,Claude Skills/AI技能模块成为技术新焦点,标志着AI从聊天工具向任务执行者的转变。与一次性指令Prompt不同,Skills是可复用、自动触发的AI能力单元,包含明确的能力边界、输入输出规范和触发策略。其爆火源于AI决策能力提升、Agent架构成熟及生态形成,使AI能真正替代人类完成任务。 当前实用Skills资源包括:Anthropic官方文档处理工具、社区精选导航站(

文章图片
LLM - 跑大模型到底要多大显存?一文讲透从原理到实战

摘要: 大模型时代,显存成为能否运行模型的首要门槛。本文系统分析显存消耗的四大来源:模型参数、中间激活、KV Cache和框架开销,并针对推理、微调、训练场景给出显存估算方法。例如,7B模型FP16推理约需18GB显存,轻量微调需24GB,而全参数训练显存需求呈数量级增长。选型建议:本地玩家可选8-24GB显卡运行7B/13B量化模型,团队服务需24-48GB显存支持长上下文与并发。合理估算显存需

文章图片
Vibe Coding - AI 编程助手提示词工程实战:从“会问”到“会驱动”

摘要: 2026年全栈开发的核心竞争力在于AI提示词工程能力。本文基于Vibe Coding指南,提出将AI视为“技术强但缺乏项目背景的资深实习生”,而非搜索引擎,并系统化总结了高效提示词的七大原则:零预设(提供丰富上下文)、目标具体化(明确输入/输出)、任务拆解(分步解决)、举例说明(Few-shot)、角色扮演(切换视角)、多轮迭代(逐步优化)和代码清洁(统一风格)。通过“五步流程”——界定任

文章图片
#人工智能
LLM - 从定制化 Agent 到 Universal Agent + Skills Library:下一代智能体架构实践

摘要: 大模型应用中的Agent架构正从「专用Agent堆叠」转向「通用Agent+技能库」范式。传统方案因上下文臃肿、维护成本高、知识无法复用而难以扩展。新架构以Universal Agent作为决策中枢,配合模块化Skills Library,实现能力的按需加载与组合。每个Skill包含元数据、详细指令和可执行资源,通过渐进式加载平衡上下文限制。该架构支持组织级知识沉淀,使新增能力只需添加Sk

文章图片
#架构
LLM - Claude Code Skills 实战指南:用模块化“技能包”重构AI 开发工作流

摘要:AI工程化新范式——Claude Code Skills机制解析 本文系统阐述了Claude Code推出的Skills机制,这是AI工程化领域的重要创新。随着大模型能力提升,团队差异已从"模型智能度"转向"AI工作流集成能力"。Skills机制通过将AI能力拆解为可组合、可复用的"技能包",解决了传统Prompt方法存在的上下文冗

文章图片
#人工智能
LLM - A2UI:Google 引领的生成式 UI 革命

A2UI(Agent-to-User Interface)是Google推出的开源项目,通过JSON格式传输"界面意图"而非可执行代码,解决了AI生成UI的安全性和兼容性问题。核心优势包括:1)安全优先设计,采用声明式JSON和预审批组件目录;2)支持流式增量渲染,提升用户体验;3)框架无关性,同一JSON可在不同平台渲染为原生UI。A2UI为生成式UI提供了安全、高效、跨平台

文章图片
#ui
LLM - 大模型选型实战指南:成本、性能与业务需求的平衡

企业级AI模型选型指南:从实验室到业务落地的三要素平衡 摘要:随着大模型技术成熟,企业面临自研、云端API和开源本地部署三大技术路线的选择困境。本文提出"成本-性能-业务"三要素平衡的选型策略:1)自研模型适合高定制场景但成本高昂;2)云端API适合快速验证但存在数据安全和隐性成本风险;3)开源本地部署(如Qwen3-30B)在多数场景下性价比最优,相比GPT-4可降低83%成

文章图片
LLM - 从通用对话到自治智能体:Agent / Skills / MCP / RAG 三层架构实战

本文提出了一种三层智能体系统架构,使大模型从通用聊天工具升级为专业自治系统。架构包含:感知层(Agent负责任务拆解与RAG检索)、决策层(Skills封装领域知识与流程)、执行层(MCP标准化连接外部系统)。MCP作为统一接口协议,通过Tools/Resources/Prompts三种原语连接业务系统;Skills则将专家经验结构化,通过渐进式加载平衡性能与成本。该架构通过分层协作实现&quot

文章图片
#MCP#RAG
Vibe Coding - Claude Code 做 Java 项目 AI 结对编程最佳实践

为 Claude Code 等 AI 开发环境准备的 开发者工具包,提供可复用的 “skills(技能)” 和 “agents(代理)”,帮助自动化代码评审、测试、API 设计和 AI 集成等任务,当前重点支持 Java/Spring Boot,同时扩展到 TypeScript/Node.js、React、NestJS 等多语言生态

文章图片
#java#结对编程
LLM - 面向工程实践的Agent Skills设计方法论

摘要: 在Agent开发中,过度加载上下文会导致性能、质量和成本问题。Anthropic提出的三层技能结构(元数据层、正文层、附属文件层)通过渐进式加载实现高效上下文管理。建议从"工具视角"转向"工作流视角"组织技能,确保每个技能聚焦单一能力。实践案例显示,将SKILL.md控制在200行内可提升4.8倍token利用率,显著降低延迟和溢出风险。落地时需审计

文章图片
    共 311 条
  • 1
  • 2
  • 3
  • 32
  • 请选择