
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
最后以一张完整流程图结束Phase1阶段Claude源码的阅读vvState 初始化vvv上下文处理:budget / snip / microcompact / collapse / autocompactvvv从 assistant content 中提取 tool_use -> toolUseBlocks+-- 没有 tool_use --> return completed+-- 有 to
使用@tool@tool"""数学计算器Args:expression: 数学表达式,如 "2+3*5"Returns:计算结果字符串"""try:return f"计算错误:str@tool def calculator(expression : str) - > str : """数学计算器Args:expression: 数学表达式,如 "2+3*5"Returns:计算结果字符串。
使用@tool@tool"""数学计算器Args:expression: 数学表达式,如 "2+3*5"Returns:计算结果字符串"""try:return f"计算错误:str@tool def calculator(expression : str) - > str : """数学计算器Args:expression: 数学表达式,如 "2+3*5"Returns:计算结果字符串。
消息队列面试准备摘要 本学习计划聚焦消息队列高频面试问题,覆盖基础概念、进阶原理、系统设计等核心知识点。基础部分包括MQ价值(解耦、削峰、异步)、Kafka高吞吐原理(顺序写入、零拷贝等)、ACK机制和消息丢失解决方案。进阶部分深入Rebalance机制、日志清理策略、Leader选举流程,以及Kafka与RabbitMQ的选型对比(吞吐量、延迟、可靠性等维度)。计划强调理解而非死记,通过分层防御
RAG(检索增强生成)技术解析与应用 RAG技术通过结合检索与生成能力,为LLM提供实时知识支持。其核心流程分为三步:索引阶段将文档分块存储为向量;检索阶段根据问题匹配最相关文档;生成阶段结合检索内容输出答案。关键技术包括Embedding(将文本转为语义向量)和相似度计算(如余弦相似度)。RAG可实现智能客服、虚拟主播等场景,但需注意数据质量和参数调优。实现方式上,Agent模式更灵活,Chai
本文系统介绍了从文本Embedding到语义搜索的完整技术流程。首先讲解了Embedding的基本概念和实现方法,使用SentenceTransformer将文本转换为固定维度向量。然后详细阐述了相似度计算(特别是余弦相似度)的原理和批量计算方法。接着介绍了语义搜索的核心流程,包括查询编码、向量匹配和结果排序。文章还展示了如何手写一个简单的向量数据库(VectorDB)以及使用高效的FAISS库进
向量数据库是一种专为存储和检索高维向量数据设计的数据库系统,通过相似度搜索而非精确匹配来查找最相关的结果。其核心原理是将非结构化数据(如文本、图像)转换为数值向量表示,使用余弦相似度、欧氏距离等度量方法进行相似度匹配。与传统数据库相比,向量数据库更适合处理语义搜索、推荐系统等AI场景。主流产品包括Pinecone、Milvus、FAISS等,各具特点:Pinecone提供全托管服务,FAISS是轻
优势局限个性化体验,76% 用户期待个性化需要大量用户数据发现新内容,用户可能从未主动搜索计算资源投入大提升转化和收入(推荐占电商收入 31%)实时性要求高(毫秒级响应)长尾产品曝光,优化库存隐私合规挑战(GDPR 等)推荐多样性,可发现意外惊喜冷启动问题(新用户/新产品)
预训练模型(PTMs)是通过大规模数据预先训练的模型,可迁移到下游任务微调使用。其发展经历了监督学习预训练(如ResNet)和自监督学习预训练(如BERT、GPT)两个时代。PTMs按架构可分为自回归模型(GPT系列)、自编码模型(BERT)和编码器-解码器模型(T5);按训练任务包括MLM、NSP等;按模态涵盖文本、图像及多模态模型(如CLIP、DALL-E)。BERT擅长理解任务,GPT擅长生
文章摘要 本文探讨了AI Agent记忆管理和上下文优化两大核心技术。External Memory通过agents.md等外部文件存储对话历史、项目信息和偏好设置,解决LLM"冷启动"问题,避免重复指令。Context Engineering则从RAG进化而来,提出Write/Select/Compress/Isolate四大策略优化上下文窗口使用,包括记忆持久化、信息筛选、







