logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【收藏必看】小白也能懂:大模型Agent核心技术与应用实践

相信前面的内容让我们对于Agent有了一个全局的认知了,接下去基本上是HandsOn去尝试,从Toy、Demo和MVP出发,最终打造出Production-Ready的Agent,在这期间有几个关键点有助于在选型和迭代过程中去辅助决策:1.权衡好延迟费用和性能,这能进一步决定是采用workflow、agent还是混合两者2.平衡好控制和授权的关系,可以更好地选择合适的agent系统设计范式3.用最

文章图片
#学习#人工智能#transformer +1
【收藏必看】小白也能懂:大模型Agent核心技术与应用实践

相信前面的内容让我们对于Agent有了一个全局的认知了,接下去基本上是HandsOn去尝试,从Toy、Demo和MVP出发,最终打造出Production-Ready的Agent,在这期间有几个关键点有助于在选型和迭代过程中去辅助决策:1.权衡好延迟费用和性能,这能进一步决定是采用workflow、agent还是混合两者2.平衡好控制和授权的关系,可以更好地选择合适的agent系统设计范式3.用最

文章图片
#学习#人工智能#transformer +1
【程序员必学】大模型训练完整流程:从随机初始化到推理微调,一篇搞定!

文章详解大语言模型训练的四个关键阶段:随机初始化阶段模型一无所有;预训练阶段通过海量语料学习语言基础;指令微调阶段学习遵循提示和回复;最后通过偏好微调(RLHF)和推理微调进一步优化,使模型更符合人类偏好并提升逻辑推理能力。

文章图片
#人工智能#前端
【程序员必学】大模型训练完整流程:从随机初始化到推理微调,一篇搞定!

文章详解大语言模型训练的四个关键阶段:随机初始化阶段模型一无所有;预训练阶段通过海量语料学习语言基础;指令微调阶段学习遵循提示和回复;最后通过偏好微调(RLHF)和推理微调进一步优化,使模型更符合人类偏好并提升逻辑推理能力。

文章图片
#人工智能#前端
Deep Research技术全解析:从Reasoning到Research with Reasoning的AI进化之路(值得收藏)

当前智能体正推动AI从随机生成文本转向围绕明确目标、依托可靠知识来解决问题。比较明确的技术路径是把像思维树(ToT)这样的多路径规划方法,和ReAct这类“思考–行动–观察”的执行循环结合起来。ToT负责在抽象层面尝试不同解法,选出可行方向;ReAct则一步步具体执行每个步骤,并根据反馈调整。这种组合让系统既能探索多种可能,又能稳扎稳打地完成任务。不过还是能看到一些实际的问题存在• 1、复杂规划和

文章图片
#人工智能#开发语言#机器学习
Deep Research技术全解析:从Reasoning到Research with Reasoning的AI进化之路(值得收藏)

当前智能体正推动AI从随机生成文本转向围绕明确目标、依托可靠知识来解决问题。比较明确的技术路径是把像思维树(ToT)这样的多路径规划方法,和ReAct这类“思考–行动–观察”的执行循环结合起来。ToT负责在抽象层面尝试不同解法,选出可行方向;ReAct则一步步具体执行每个步骤,并根据反馈调整。这种组合让系统既能探索多种可能,又能稳扎稳打地完成任务。不过还是能看到一些实际的问题存在• 1、复杂规划和

文章图片
#人工智能#开发语言#机器学习
2025大模型学习避坑指南:小白&程序员必藏,从入门到进阶的实战心法

很多人迟迟不敢开始学大模型,是怕“学不会”“学了没用”。但真相是,大模型技术还在快速发展,现在的核心不是“学得多深”,而是“先入局,在实践中迭代”。我带过最普通的学员,是一位40岁的行政阿姨,她学大模型不是为了转岗,只是用ChatGPT批量整理会议纪要,用AI工具做报表,工作效率提升后,不仅涨了薪,还成了公司的“AI小能手”。大模型不是“高科技门槛”,而是“新时代的工具”。

文章图片
#学习#人工智能#transformer +2
2025大模型学习避坑指南:小白&程序员必藏,从入门到进阶的实战心法

很多人迟迟不敢开始学大模型,是怕“学不会”“学了没用”。但真相是,大模型技术还在快速发展,现在的核心不是“学得多深”,而是“先入局,在实践中迭代”。我带过最普通的学员,是一位40岁的行政阿姨,她学大模型不是为了转岗,只是用ChatGPT批量整理会议纪要,用AI工具做报表,工作效率提升后,不仅涨了薪,还成了公司的“AI小能手”。大模型不是“高科技门槛”,而是“新时代的工具”。

文章图片
#学习#人工智能#transformer +2
【必学收藏】大模型检索增强生成(RAG)全解析:从入门到精通

RAG技术通过连接LLM内部参数化知识与外部非参数化知识库,解决了大模型可能产生不准确信息、无法利用最新知识及专业领域知识缺失等问题。文章系统介绍了RAG的三大支柱(检索、生成、增强)、三大发展范式(Naive、Advanced、Modular RAG),以及预训练、微调和推理阶段的优化方法,并探讨了RAG评估框架和未来挑战,为研究者和工程师提供了全面的技术全景图和路线指南。近年来,大语言模型 (

文章图片
#学习#transformer#深度学习 +1
【必学收藏】大模型检索增强生成(RAG)全解析:从入门到精通

RAG技术通过连接LLM内部参数化知识与外部非参数化知识库,解决了大模型可能产生不准确信息、无法利用最新知识及专业领域知识缺失等问题。文章系统介绍了RAG的三大支柱(检索、生成、增强)、三大发展范式(Naive、Advanced、Modular RAG),以及预训练、微调和推理阶段的优化方法,并探讨了RAG评估框架和未来挑战,为研究者和工程师提供了全面的技术全景图和路线指南。近年来,大语言模型 (

文章图片
#学习#transformer#深度学习 +1
    共 841 条
  • 1
  • 2
  • 3
  • 85
  • 请选择