Dust-Chasing 个人主页

@2401_87984738

Dust-Chasing

2024-11-05 15:56:53 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Claude Code源码剖析 - Claude 中Tools的抽象

模型说“我要用工具”Claude Code runtime 如何把它变成本地动作，再把结果变回模型能理解的消息？-> 本地 runtime 找工具-> 校验输入-> 权限检查-> 执行工具-> 生成 user/tool_result-> 回填 messages-> 下一轮模型调用ToolnameisReadOnlycall工具不是普通函数。工具 = schema + 权限 + 执行 + 结果映射

#人工智能 #python

Claude Code源码剖析 - Agent 最小闭环

摘要本文档记录了Claude Code源码解析的第一阶段笔记，聚焦Agent最小闭环的实现机制。主要内容包括：阅读目标：追踪Agent循环的主线流程，理解模型与工具交互的核心机制文件结构分析：query.ts的主体是1500行的queryLoop函数 QueryParams：启动Agent循环所需的完整参数包，包含对话历史、工具权限、运行环境等 State类型：记录循环间的可变状态，重点是m

#人工智能 #python

Claude Code源码剖析 - 文件读取与代码搜索工具

本文介绍了Claude Code中的文件读取工具(Read Tool)的设计与实现。该工具允许AI模型通过结构化请求读取本地文件内容，支持文本、图片、PDF和Jupyter notebook等多种文件类型。工具设计考虑了上下文长度限制，支持分页读取和局部读取功能。文章详细解析了工具的输入输出Schema、注册流程、并发安全属性、路径规范化处理以及权限检查机制。特别强调了该工具虽然是只读操作，但仍需

#python #人工智能

Claude Code源码剖析 - Claude Code 上下文压缩机制

Claude Code 上下文压缩机制摘要 Claude Code 的上下文压缩是一套多层级的上下文治理系统，旨在解决模型运行时的上下文窗口限制问题。该系统通过以下机制协同工作：输入视图切片：从最近的压缩边界开始截取消息工具结果清理：限制单条工具结果的体积历史视图裁剪：选择性保留关键历史消息自动压缩：生成历史摘要替代冗长内容失败恢复：处理API错误后的上下文重建压缩过程集成在Agent

#人工智能 #python

AI应用开发 - Prompt Engineering(提示词工程)

摘要：Prompt Engineering 方法对比与应用 Zero-shot 和 Few-shot 是两种核心的Prompt Engineering方法。Zero-shot依赖预训练模型的知识直接推理，无需示例，适合快速验证或数据稀缺场景，但性能依赖模型质量；Few-shot提供少量示例，能稳定输出格式并适配特定领域，但需人工设计示例。两者各有优劣，选择取决于任务复杂度、数据可用性和格式要求。

#人工智能 #学习

AI应用开发 - Context Engineering(上下文工程)

文章摘要本文探讨了AI Agent记忆管理和上下文优化两大核心技术。External Memory通过agents.md等外部文件存储对话历史、项目信息和偏好设置，解决LLM"冷启动"问题，避免重复指令。Context Engineering则从RAG进化而来，提出Write/Select/Compress/Isolate四大策略优化上下文窗口使用，包括记忆持久化、信息筛选、

#人工智能 #数据库 #学习

AI应用开发 - What are Embeddings

优势局限个性化体验，76% 用户期待个性化需要大量用户数据发现新内容，用户可能从未主动搜索计算资源投入大提升转化和收入（推荐占电商收入 31%）实时性要求高（毫秒级响应）长尾产品曝光，优化库存隐私合规挑战（GDPR 等）推荐多样性，可发现意外惊喜冷启动问题（新用户/新产品）

#人工智能 #python

AI应用开发 - Vector Databases

向量数据库是一种专为存储和检索高维向量数据设计的数据库系统，通过相似度搜索而非精确匹配来查找最相关的结果。其核心原理是将非结构化数据（如文本、图像）转换为数值向量表示，使用余弦相似度、欧氏距离等度量方法进行相似度匹配。与传统数据库相比，向量数据库更适合处理语义搜索、推荐系统等AI场景。主流产品包括Pinecone、Milvus、FAISS等，各具特点：Pinecone提供全托管服务，FAISS是轻

#人工智能 #学习 #python

AI应用开发 - Embeddings Practical Exercises(附参考源码)

本文系统介绍了从文本Embedding到语义搜索的完整技术流程。首先讲解了Embedding的基本概念和实现方法，使用SentenceTransformer将文本转换为固定维度向量。然后详细阐述了相似度计算（特别是余弦相似度）的原理和批量计算方法。接着介绍了语义搜索的核心流程，包括查询编码、向量匹配和结果排序。文章还展示了如何手写一个简单的向量数据库(VectorDB)以及使用高效的FAISS库进

#人工智能 #学习 #python

AI应用开发 - What are RAGs?

RAG（检索增强生成）技术解析与应用 RAG技术通过结合检索与生成能力，为LLM提供实时知识支持。其核心流程分为三步：索引阶段将文档分块存储为向量；检索阶段根据问题匹配最相关文档；生成阶段结合检索内容输出答案。关键技术包括Embedding（将文本转为语义向量）和相似度计算（如余弦相似度）。RAG可实现智能客服、虚拟主播等场景，但需注意数据质量和参数调优。实现方式上，Agent模式更灵活，Chai

#人工智能 #数据库

共 43 条

请选择