logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI代理到底怎么玩?

当前AI Agent和RAG(检索增强生成)最流行的架构包括基础RAG、代理式RAG路由、查询规划代理式RAG等,研究表明这些架构在提升AI性能方面效果显著。代理式RAG架构允许AI根据查询动态选择工具或数据源,证据倾向于其在复杂任务中表现优异。本文每个讨论到的架构都有代码示例,适合快速入门,帮助理解实际实现。

文章图片
#人工智能#python#机器人 +3
一文读懂啥是GRPO

Group Relative Policy Optimization(GRPO)是一种新型的强化学习算法,由DeepSeek提出,旨在提升大语言模型(LLMs)在推理任务中的表现。它基于近端策略优化(PPO)框架进行改进,通过独特的奖励机制和策略更新方式,使模型在训练过程中能够更有效地学习和优化策略,从而增强模型的推理能力和性能。与传统的强化学习算法不同,GRPO在训练过程中摒弃了价值网络,采用组

文章图片
#人工智能#python#深度学习 +3
混合专家模型:DeepSeek的中流砥柱,具身智能的他山之石

MoE是DeepSeek劈开算力壁垒的盘古巨斧,会成为具身领域的他山之石吗?

文章图片
#python#人工智能#机器学习 +4
DeepSeek:具身智能的高层级大脑

DeepSeek赋能一切,当然也包括具身智能。

文章图片
#python#深度学习#人工智能 +3
到底了