
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文深入解析了LLM生成文本时的三个关键采样参数——Temperature、Top-k和Top-p的作用机制及其相互关系。文章从底层公式出发,通过流程图和数学分析揭示了这些参数如何影响softmax概率分布:Temperature在softmax前对logits进行缩放,控制输出的确定性;Top-k和Top-p则在softmax后进行截断,分别通过固定数量和动态概率阈值来筛选候选词。研究指出,这些

介绍 Agent Skills 的核心概念与基础架构。从"什么是 Skill"出发,讲解三层架构设计(描述层→逻辑层→执行层),梳理 Skill 从意图识别、指令加载、任务执行到结果返回的完整生命周期,并解析 Skill 的注册机制、上下文注入、动态加载与卸载机制,最后概述串行、并行、条件路由三种协作编排模式。

传统 RAG 依赖固定的"检索-生成"流程,面对复杂研究任务时常显得力不从心。Agentic RAG 通过引入 AI Agent 的自主决策能力,让检索系统具备了主动规划、多轮迭代、工具调用和记忆管理的能力。本文从架构原理出发,详细对比了 Agentic RAG 与传统 RAG 在检索策略、推理模式、交互方式等方面的差异,并提供了完整的评估指标体系、主流框架对比、常见问题排错指南以及安全与隐私考量

传统 RAG 依赖固定的"检索-生成"流程,面对复杂研究任务时常显得力不从心。Agentic RAG 通过引入 AI Agent 的自主决策能力,让检索系统具备了主动规划、多轮迭代、工具调用和记忆管理的能力。本文从架构原理出发,详细对比了 Agentic RAG 与传统 RAG 在检索策略、推理模式、交互方式等方面的差异,并提供了完整的评估指标体系、主流框架对比、常见问题排错指南以及安全与隐私考量

摘要 Sigma(σ)是扩散模型中控制噪声强度的核心参数,决定了数据在扩散过程中的破坏程度。本文系统阐述了Sigma的数学定义、在离散/连续时间框架下的表现形式,及其在模型训练和采样中的关键作用。Sigma与噪声调度、损失函数权重、KL散度优化等密切相关,不同实现(如DDPM、SDE)对Sigma有不同处理。文章还探讨了Sigma与CFG的交互、EDM框架中的调度策略,以及数值稳定性等问题,为理解

本文摘要(150字): 正则化是防止模型过拟合的关键技术,通过向损失函数添加约束项来限制模型复杂度。文章系统介绍了24种正则化方法:1) L1正则化通过绝对值惩罚产生稀疏解,适用于特征选择;2) L2正则化通过平方惩罚平滑权重,提升数值稳定性;3) Dropout随机屏蔽神经元实现模型集成;4) 早停法在验证误差上升时终止训练;5) 数据增强扩展训练样本多样性。其他方法包括权重衰减、标签平滑、知识

摘要 本文系统介绍了Agent上下文的核心概念与工程实践。上下文作为模型处理任务时的信息集合,直接影响Agent的行为质量与任务完成能力。主要内容包括: 上下文组成:分为静态(System Prompt、工具定义)和动态(对话历史、工具返回结果等)两部分,构成模型的"工作台"。 生命周期管理:从初始化、更新到销毁的全流程控制,重点关注Token计数与长度限制。 System Prompt设计:作为

本文探讨了AI Agent在生产环境中面临的可靠性挑战及解决方案。文章首先分析了从Demo到生产的鸿沟,指出Agent在实际应用中可能遇到的多种故障场景。随后提出可靠性五维模型(可用性、正确性、安全性、可控性和可观测性),并构建了完整的威胁模型,从基础设施层、模型层和应用层三个维度详细分类各类威胁。 在架构设计部分,文章提出分层架构方案,包含用户交互层、护栏层、Agent编排层等六个层级,并介绍了

本文系统性地介绍了深度学习大模型权重文件的各种格式及其特点。主要内容包括: 权重文件基础概念:解释了模型权重包含的参数类型(权重矩阵、偏置、归一化参数等)、典型的数据结构,以及不同精度(FP32、FP16、INT8等)对模型大小和性能的影响。 常见权重文件格式: PyTorch格式(.pt/.pth/.bin):原生格式,支持完整模型状态但存在安全风险 SafeTensors格式(.safeten

《多平台商品搜索与比价系统技术架构》 本文介绍了一个支持多平台数据聚合的智能搜索与比价系统架构,主要包含以下内容: 系统采用分层架构设计,包括前端应用层、服务层、数据处理层和数据存储层,各层级通过标准接口通信。 关键技术选型包括:Spring Boot后端框架、Elasticsearch 8.x支持混合检索、Qwen和SPLADE向量模型实现文本向量化,以及Selenium用于动态页面采集。 数据








