
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
摘要(149字): 离散扩散模型(如LLaDA)采用mask-and-predict方法,通过逐步替换token为[MASK]实现文本生成。然而该方法存在三个根本问题:(1)噪声定义不自然,信息呈二值跳变;(2)数学工具受限,无法直接应用连续空间的优化方法;(3)信息瓶颈导致模型依赖上下文推测被mask内容。Cola-DLM提出转向连续隐空间扩散,通过VAE将离散文本映射到连续空间后应用Flow

本文对比了扩散模型中的DDPM和Flow Matching方法。DDPM通过离散时间步逐步去噪,通常需要1000步推理,存在误差累积问题。Flow Matching则直接学习连续速度场,通过ODE求解实现更高效的生成(仅需10-50步)。文章以Cola DLM为例,说明Flow Matching具有步数少、确定性生成、连续空间适配等优势。核心区别在于:DDPM基于SDE和噪声预测,而Flow Ma

本文探讨了语言生成模型的三种范式:自回归(AR)、离散扩散和连续隐空间扩散。自回归模型(如GPT)通过链式法则逐token生成文本,具有训练高效但缺乏全局规划的缺陷。扩散模型在图像领域表现出色,但应用于离散文本面临挑战。研究者提出两种解决方案:离散扩散(如LLaDA)直接在token空间进行mask-and-predict操作,而连续隐空间扩散(如Cola DLM)通过VAE将文本映射到连续空间进

这篇文章深入解析了System Prompt在LLM调用中的关键作用,并提供了完整的API调用实践指南。主要内容包括: System Prompt的本质解析 揭示了网页版ChatGPT与API调用的关键差异在于隐藏的System Prompt 将System Prompt比作"岗位说明书",决定模型的行为模式 核心技术原理 提出模型输出公式:输出=f(System Prompt

本文介绍了从零开始复现Claude Code的核心思路,将其类比为"带着工具箱的实习生",并拆解为三层架构: 大脑层(LLM):负责思考规划,决定使用哪些工具 工具层:包含读文件、写文件、执行命令等具体功能 系统层:实际的操作系统和代码环境 关键创新点在于: 采用"思考→行动→观察"的ReAct循环工作模式 通过工具调用形成闭环反馈,而非直接输出代码 系统提

本文深入解析了ReAct循环(Reasoning+Acting)的工作原理,这是构建智能Agent的核心机制。通过密室逃脱游戏的类比,作者生动展示了人类解决问题的"观察-思考-行动"循环模式。文章详细拆解了ReAct循环的数学公式和实现步骤,包括状态更新、思考决策、执行行动和反馈观察的完整闭环。对比了普通对话模型与ReAct Agent的本质区别,强调后者能通过循环执行和反馈调

本文介绍了如何为AI代理(Agent)实现真实的文件读写能力,使其从模拟环境转向实际操作。文章首先回顾了前几篇实现的ReAct循环框架,指出当前代理只能输出操作指令但无法实际执行的问题。通过"实习生"比喻,形象说明需要为代理赋予"双手"来真正操作文件系统。 文章详细解析了工具调用的完整闭环流程,包括:1)模型输出操作指令;2)解析指令字符串;3)执行真实工具

摘要:赋予AI执行终端命令的能力 本文是"零基础复现Claude Code"系列的第五篇,重点讲解如何安全地赋予AI执行终端命令的能力。通过对比文件读写和命令执行的风险等级,作者指出命令执行是最危险的能力,必须谨慎设计。 关键实现: 双重安全机制:黑名单(禁止危险命令)+白名单(只允许安全命令) 输出截断策略:限制返回内容长度,防止Token爆炸 超时控制:30秒自动终止长时间

这篇文章摘要介绍了如何将零散的AI Agent组件整合成一个完整的可执行程序。文章分为三个主要部分: 整体架构:将之前开发的各个模块(LLM客户端、ReAct循环、文件操作工具、命令行工具)整合成一个统一的系统,创建命令行入口让用户可以直接运行Agent。 关键技术: 采用滑动窗口策略管理对话历史,在保留关键信息的同时控制Token消耗 设计循环终止条件(任务完成、无行动输出、达到最大轮数) 实现

文章摘要(148字): 本文介绍了如何让AI Agent具备项目级代码理解能力,从单文件处理扩展到整个项目。作者通过"实习生"比喻说明当前Agent的局限性,提出用检索增强生成(RAG)原理实现代码搜索功能。文章详细对比了简陋版与工业级解决方案的差异,并给出一个基于关键词匹配的Python实现(search_code工具)。该方法通过遍历目录、过滤无关文件、匹配关键词来找到相关








