qqxhb 个人主页

@qq_43792385

qqxhb

2022-07-08 16:58:14 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

13｜Tool Calling：让模型“执行”而不只是“回答”

要让 AI 用工具，你得先给它写一份“说明书”。这份说明书通常是用写的。"description": "用于执行数学计算。当用户询问数学问题时使用。","description": "要计算的数学表达式，例如 '2 + 2' 或 '100 * 0.5'"},关键点name：工具的名字（AI 靠这个引用）。最重要！告诉 AI 什么时候该用这个工具。如果你写得不清不楚，AI 就不会用。paramete

66｜把团队 SOP 写成 Skills：从“口口相传”到“按需加载”

本文介绍了如何将团队SOP（标准作业程序）转化为可复用的AI技能包（Skills），解决知识沉淀和执行问题。通过三个实战案例（代码审查、智能调试、单元测试生成），演示了Skill的构建方法：结合结构化Prompt（SKILL.md）和工具配置（manifest.json），将工作流程自动化。Skill的核心价值在于将传统文档转化为可执行代码，强制团队规范执行，显著提升开发效率。文章最后提出技能治理

#单元测试

64｜接入工具：文件/网络/数据库至少两类工具

本文介绍了如何为AI Agent配备执行阶段的工具，重点强调安全封装与权限控制。核心要点：工具封装：网络抓取工具需过滤HTML噪声并限制文本长度（如2000字），文件写入工具必须隔离工作目录，防止越权操作。工具描述：通过JSON Schema向AI清晰说明工具功能（name、description、parameters），避免误用。权限管理：工具需严格登记权限边界（如只读数据库、封闭文件路径

64｜接入工具：文件/网络/数据库至少两类工具

59｜回归与发布：让改动可追踪、可回滚

本文介绍了在AI编程时代保护项目成果的三大核心策略：1. 使用Git作为"后悔药"，通过版本控制快速回退失败修改；2. 让AI编写回归测试脚本，确保新功能不影响原有功能；3. 建立迭代复盘模板，记录每次修改的改动范围、问题及修复方案。文章总结了完整的"个人AI编程工作流"闭环：从需求拆解、生成自检到回归发布，强调Git存档和测试脚本的重要性。这套方法论让开发者能够安全高效地进行AI辅助编程，为后续

#回归

03｜模型与产品形态：Chat、IDE 助手、API、本地模型怎么选

本文系统分析了AI编程工具的四大形态（网页聊天机器人、IDE插件、API调用、本地模型），从智商、上下文窗口、价格三个维度对比优缺点。针对不同场景推荐组合方案：入门用户可选免费Trae+DeepSeek网页版，进阶开发者建议Cursor Pro+Claude 3.5 Sonnet API。特别提醒避免GPT-3.5等过时模型，强调根据项目敏感度、开发复杂度灵活搭配工具。最后提供决策树帮助读者快速匹

07｜Token 与上下文窗口：为什么它会忘、为什么会贵

摘要： Token是AI计费的最小单位，不同于字数，它是文本被切分后的数字块。英文1 Token≈0.75单词，中文1 Token≈0.5-0.8汉字（新模型优化后更便宜）。Token数量直接影响费用和响应速度。 AI的“记忆”受限于上下文窗口（如GPT-4o支持128k Token），超限时早期对话会被截断，导致“遗忘”。每次对话API会重复计算历史Token，导致长对话成本滚雪球式增长，建议适

36｜RAG 评测与回归：命中率、覆盖率、引用正确性

《RAG系统评测指南：告别“感觉好用”，科学评估三大黄金指标》本文针对RAG（检索增强生成）系统上线前的关键评测环节，提出必须通过自动化机制取代主观判断。核心方法论围绕三大黄金指标：命中率（检索准确性）：确保系统能定位正确资料片段，达标门槛>0.85；忠实度（生成可靠性）：杜绝大模型虚构内容，要求>0.95且零容忍幻觉；答案覆盖率（回答完整性）：检查是否全面解决用户问题，基准>0.80。

#回归 #数据挖掘 #人工智能

共 97 条

请选择