logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

[大模型面试系列] 吃透Agent三大核心范式,ReAct,Plan-and-Execute,Reflection面试与工程落地全解析

本文深入解析人工智能智能体开发的三大主流设计范式:ReAct、Plan-and-Execute和Reflection。ReAct采用边想边执行的灵活模式,适合轻量级任务;Plan-and-Execute通过先规划后执行的解耦方式,更适合复杂长流程任务;Reflection则是质量增强机制,用于修正输出错误。文章从核心原理、优劣势到适用场景进行了系统对比,指出三者并非并列关系而是互补配合:前两者解决

文章图片
#面试#react.js#职场和发展 +1
读懂深度学习训练核心,从梯度下降到LayerNorm的实用解析与思考

深度学习核心技术解析:从梯度下降到激活函数 摘要:本文深入浅出地解析深度学习训练的核心技术体系。梯度下降作为模型的"导航仪",通过损失函数评估误差并指导参数调整方向,其三种形式(BGD、SGD、Mini-batch)各有适用场景。激活函数则是模型的"灵魂",为网络注入非线性能力:Sigmoid适合二分类输出层但存在梯度消失问题;Tanh改进了输出偏移但仍有局

文章图片
#深度学习#人工智能
[大模型面试系列] 如何设计一个生产级LLM Gateway

本文探讨了在大模型技术普及背景下,企业构建LLM Gateway的必要性和设计方案。文章指出,随着业务复杂度提升,多模型混用会导致接口混乱、运维成本高、容错能力弱等问题。LLM Gateway作为统一入口,采用三层架构设计:接入层负责协议适配和鉴权,决策层实现智能路由和负载均衡,出口层处理API调用和响应转换。核心模块包括基于能力/成本的路由策略、故障降级机制等,旨在实现模型调用的统一管控、成本优

文章图片
#面试#gateway#职场和发展 +1
告别盲目氛围编程,沉淀可落地的Vibe Coding工程化开发模式

AI编程工程化实践指南 本文系统梳理了AI编程从"氛围式开发"到工程化落地的完整方法论。针对当前AI编程存在的稳定性差、技术债堆积等问题,提出了三大基础模式和五大实战模式: 三大基础模式: 四阶段开发模式(规划-设计-实现-验证) 规格驱动开发模式(Spec-Driven) 子智能体并行开发模式 五大实战模式: Spec-First规格先行:需求文档结构化,开发前完成三层规范设

文章图片
#人工智能
[大模型面试系列] 深度解析ReAct框架,大模型Agent的“思考+行动”底层逻辑

ReAct框架是大模型Agent实现自主思考与行动的核心范式,通过“推理+行动”的闭环循环解决复杂任务。其工作流程为Thought→Action→Observation的迭代循环:模型先推理当前任务目标(Thought),执行相应动作(Action),观察外部反馈(Observation)后继续思考,直至任务完成。以查询电影导演及其最高评分作品为例,ReAct通过多轮搜索和数据分析逐步获取信息,最

文章图片
#面试#react.js#职场和发展 +1
封神级 RAG 优化实战,query 改写 + prompt 构建,吃透面试核心考点

RAG系统优化:Query改写与Prompt构建实战指南 摘要: 本文深入剖析RAG系统中两大核心优化环节:query改写与prompt构建。针对query改写,提出指代消解、查询分解和多角度改写三大策略,有效解决口语化表达、复合问题和检索召回率低等痛点。在prompt构建方面,强调检索结果的组织与优先级排序对生成质量的关键影响。通过实际案例和prompt模板展示,为开发者提供了一套可落地的RAG

文章图片
#面试#职场和发展#人工智能
[大模型面试系列] RAG系统检索失效全链路排查指南,从根源定位到落地优化方法

摘要 RAG检索增强生成系统在实际应用中常出现检索失效问题,表现为无法召回知识库中已有的相关内容。本文系统性地拆解了RAG全链路排查方法,提出四层逐级排查框架: 文档入库与分层质量:检查文档完整性、分块策略合理性及元数据过滤规则; 嵌入模型与语义匹配:验证模型版本一致性、领域适配性及查询-文档表述对齐; 检索参数与索引配置:调整相似度阈值、TopK数量及向量数据库索引参数; 重排序与后处理:排查重

文章图片
#人工智能
[大模型面试系列] 深度解析如何提升AI Agent规划能力,从原理到落地全方案

AI Agent规划能力已成为复杂任务落地的关键瓶颈。本文系统分析了规划能力的四大核心职能(目标拆解、依赖建模、执行调度、动态重规划),指出传统ReAct架构在长程任务中存在的错误累积效应和上下文污染问题。针对这些痛点,文章提出了五大主流解决方案:Plan-and-Execute架构实现规划与执行解耦;任务解耦规划通过DAG图管理子任务;图结构工作流支持并行执行;层次化规划分离全局与局部决策;重规

文章图片
#人工智能
[大模型面试系列] 多轮对话 Agent 设计实战(含窗口优化 + 工具调用精髓)

摘要: 多轮对话Agent的设计核心在于为无状态的LLM构建有状态的对话管理机制,需解决三大关键能力:上下文感知、跨会话记忆和灵活应变。设计要点包括: 对话历史管理:采用滑动窗口、摘要压缩或选择性保留策略,平衡token限制与信息完整性,常用混合方案优化效率。 记忆系统分层: 工作记忆:维护当前会话上下文,通过动态压缩避免溢出; 短期记忆:存储结构化关键信息(如用户偏好),提升检索效率; 长期记忆

文章图片
#面试#人工智能#职场和发展
通用AI Agent驱动网关路由安全审计实践方案

摘要 本文提出了一种基于AI Agent的网关路由安全审计系统,以解决传统人工审计模式面临的覆盖面不足、时效性滞后和规则标准化难题。系统采用"通用Agent+业务Skill"分层架构,通过增量日检与存量月检机制实现全量覆盖和分钟级响应。核心设计将AI分析能力与工程调度分离,业务逻辑沉淀在Skill层实现快速迭代。以越权漏洞为例,系统采用四步式检测流程和精细化分类方法,结合&qu

文章图片
#人工智能#安全
    共 260 条
  • 1
  • 2
  • 3
  • 26
  • 请选择