logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

亲手复现DeepSeek-R1-Zero实验完整解读

本文给大家分享个人亲手复现R1-Zero的全过程,包括对关键源码的解读、训练过程和实验结果分析。TL;DR,整个项目只需要定制2处地方:另外在main_ppo.py训练入口中的注册该reward function即可。如果想定制训练自己的推理任务,只需要处理上述两处代码即可。又可以愉快地调包了 (:中途遇到问题:模型和数据基于Qwen2.5-3B复现。下载作者上传的数据集Jiayi-Pan/Cou

文章图片
#人工智能#自然语言处理
从AI助手到自主Agent场景分析:项目经理如何选择最适合的LLM策略?

在项目实施过程中,选择适合的LLM应用模式需要基于具体的业务需求、AI的能力、团队的合作方式以及对AI结果的可控性进行权衡。通过这篇文章,项目管理者可以清晰地识别不同应用模式的优缺点,并根据项目的复杂度、AI能力需求以及团队合作的特点选择最合适的模式。因此,在实施AI Agent模式时,团队需要对AI的自主能力有充分信任,并能够设计合理的监督机制以确保AI的表现符合预期。AI Agent模式则适合

文章图片
#人工智能#自然语言处理
全网爆火的第一本程序员的Agent入门书籍——《大模型应用开发 动手做AI Agent》

这本书一共9章,涉及到基础理论、Agent 框架、Multi-Agent、代码实战等丰富内容,整本书更偏向教程实战,就像书名所说的,相当一部分都是代码教学而非枯燥的理论研究,我认为即使是代码小白,也能跟着步骤一步一步用代码实现一个 Agent!书中既介绍了 ReAct、LangChain 等经典框架,也涉及了爆火的 AutoGPT、Camel 等,还有 AutoGen、MetaGPT 这样的多智能

文章图片
#人工智能
力压西瓜书和复旦LLM❗一本书读懂AI Agent!,带你全方位解析Agent!(附文档pdf)

人工智能时代一种全新的技术— Agent正在崛起。今天就给大家分享下这本LLM大模型的书《大模型应用开发 动手做AI Agent》,本书从AI agent的角度探索目前人工智能最前沿的技术发展,并且借助开源框架带着读者亲手制作7个常用的agent。本书将探索Agent的奥秘,内容包括从技术框架到开发工具,从实操项目到前沿进展,通过带着读者动手做7个 功能强大的Agent,全方位解析Agent的设计

文章图片
#人工智能#自然语言处理
怒推一万次的顶尖名校公开课-LLM Agents

伯克利Dawn Song教授和Google deepmind Xinyun Chen研究员将从9.9日起讲授LLM Agents公开课,课程内容非常丰富:Reasoningalignment还有非常雄厚的guest speakers!感兴趣的小伙伴不要错过!

文章图片
#自然语言处理#人工智能#深度学习
Function Call & ReACT,Agent应用落地的加速器_qwen的function calling和react有什么不同

(Workflow)的情况下,利用外部工具或功能,选择要执行的一系列操作。对于 toB 产品,智能体能够解决功能点繁多、使用链路冗长、使用方法复杂难上手等问题。从技术角度来看,智能体通过大模型理解用户意图并生成结构化描述,进而执行相关操作。因此,智能体在实际应用中扮演着至关重要的角色,成为了连接大模型和现有应用的桥梁。

文章图片
#react.js#前端#前端框架 +4
万字长文!AI Agent架构概况:关于推理、规划和工具调用

AI Agent(智能体)是近来一个火热的话题。我之前也写了几篇文章介绍AI Agent方面的应用,但并没有深入挖掘其背后的技术细节。今天这篇文章就来聊一聊AI Agent背后的故事。这是一篇由IBM和微软的研究人员于2024年4月发表的名为《The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and

文章图片
#人工智能#语言模型
复旦NLP团队发布80页大模型Agent综述,一文纵览AI智能体的现状与未来

智能体会成为打开 AGI 之门的钥匙吗?复旦 NLP 团队全面探讨 LLM-based Agents。近期,复旦大学自然语言处理团队(FudanNLP)推出 LLM-based Agents 综述论文,全文长达 86 页,共有 600 余篇参考文献!作者们从 AI Agent 的历史出发,。同时,作者们探讨了 Agent 相关的前瞻开放问题,对于相关领域的未来发展趋势具有重要价值。论文链接:htt

文章图片
#人工智能#自然语言处理#AI
Agent四大范式 | 综述:全面理解Agent工作原理

随着大型语言模型(LLMs)展现出显著的智能,将其应用于自主代理规划模块的研究受到了广泛关注。本综述首次系统性地审视了基于 LLM 的代理规划,涵盖了提升规划能力的最新研究成果。我们对现有的 LLM-代理规划研究进行了分类,将其分为任务分解、计划选择、外部模块、反思和记忆等类别,并针对每个方向进行了深入分析。同时,我们也探讨了该研究领域面临的挑战。Autonomous agents 又被称为智能体

文章图片
#深度学习#人工智能#自然语言处理
一文彻底搞懂大模型 - Dify(Agent + RAG)

Dify 是一个用于构建 AI 应用程序的开源平台。Dify融合了后端即服务(Backend as Service)和LLMOps理念。它支持多种大型语言模型,如Claude3、OpenAI等,并与多个模型供应商合作,确保开发者能根据需求选择最适合的模型。Dify通过提供强大的数据集管理功能、可视化的Prompt编排以及应用运营工具,大大降低了AI应用开发的复杂度。

文章图片
#人工智能#AI#RAG
    共 39 条
  • 1
  • 2
  • 3
  • 4
  • 请选择