logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLM漫谈(十)| DeepSeek R1 微调指南

在本文中,我们将深入探讨使用 Python 微调 DeepSeek R1模型的过程。

文章图片
#人工智能#AIGC
LLM之Agent(二十七)| Manus 上下文管理经验揭秘

上下文缩减与上下文卸载类似,但它的做法则是对信息进行摘要或压缩。一个直观的方法是摘要工具调用的输出,Open Deep Research 项目中已经采用了该方法。另一个方法是精简 (pruning) 工具调用或工具消息。有趣的是,Claude 3.5 Sonnet 实际上已经内置了这个功能。如果你去看他们最近的发布,会发现它现在原生支持这个特性。所以,精简掉旧的工具调用和输出,已经成为 Claud

文章图片
#人工智能
LLM之Agent(二十六)| LangChain × LangGraph 1.0 正式发布:AI 智能体迈入“工业化”纪元

在过去三年中,社区用户不断反馈:LangChain “抽象过重”“结构臃肿”,开发者希望在不放弃原始 LLM 调用的情况下更好地控制代理循环。LangChain 1.0 与 LangGraph 1.0 的发布,标志着首个稳定版本的发布,并且已经在 Uber、LinkedIn、Klarna等企业的生产环境验证过,其目标是把“智能体”从 Jupyter 笔记本搬进 CI/CD,从“脚本”升级为“系统”

文章图片
#人工智能
LLM之Agent(三十八)|AI Agents(七):Multi-Agent架构

每个智能体只与智能体的一部分通信。部分智能体通信是确定的,部分智能体可以决定接下来要呼叫哪些其他智能体。在这种架构中,我们将各个智能体添加为图节点,并预先定义智能体在自定义工作流中的调用顺序。

文章图片
#人工智能#架构
LLM微调(六)| 使用Unsloth框架和TRL库通过 GRPO强化学习算法对 Qwen 2.5 (3B) 进行对齐

这是 GRPO 的核心,模型生成的每个结果都会经过这些函数打分。​​​​​​​# 奖励函数 1:正确性奖励# 功能:检查模型生成的答案(从 XML 中提取)是否与标准答案完全一致。正确得 2.0 分,否则 0 分。# 打印日志方便调试# 奖励函数 2:整数奖励# 功能:检查提取出的答案是否为数字。是则得 0.5 分。# 奖励函数 3:严格格式奖励# 功能:使用正则检查输出是否严格符合 <reaso

文章图片
#算法
LLM之Agent(三十六)|AI Agents(五):Workflow vs Agent

其次,LLM 能够提供此类反馈。对于涉及多个方面的复杂任务,如果每个方面都由单独的 LLM 调用来处理,则 LLM 通常表现更佳,这样可以集中精力关注每个特定方面。当任务复杂性较高时,我们可以使用workflows的可预测性和一致性优点来解决流程固定的任务,而智能体则更适合需要大规模灵活性和模型驱动决策的场景。在LLM应用领域,成功的关键不在于构建最复杂的系统,而在于构建最符合自身需求的系统。从简

文章图片
#人工智能
LLM(十八)| Anthropic发布史上最强编程模型:Claude 4

这也是Claude自2024年6月以来的首次大版本号更新。Amodei称,Anthropic已经有一段时间没有更新Opus模型了,Anthropic对Opus的定位是旗下最强大、最智能的模型,而Sonnet是用户过去大约一年来一直在使用的中等水平模型。Claude Opus 4在多项基准测试上的成绩并未明显高于Claude Sonnet 4,甚至略低于后者。Amodei强调,

文章图片
#AIGC#人工智能
LLM之Agent(三十九)|AI Agents(八):构建Multi-Agent系统

函数调用是大型语言模型 (LLM) 与工具交互的主要方式。经常会看到“函数”和“工具”互换使用,因为“函数”(可重用代码块)是智能体用来执行任务的“工具”。工具通过使用底层应用程序或系统的 API 来扩展智能体的功能。对于没有 API 的旧系统,智能体可以依赖computer-use模型,像人一样通过 Web 和应用程序 UI 直接与这些应用程序和系统交互。每个工具都应具有标准化的定义,从而实现工

文章图片
#人工智能#microsoft
LLM之Agent(十四)| 字节开源ComputerUse纯视觉驱动GUI 智能体模型 UI-TARS

Agent TARS 是一款开源的多模态 AI 智能体,能够基于视觉理解网页内容,并与浏览器、命令行和文件系统无缝集成,实现复杂任务的规划与执行。它旨在为用户提供高效、便捷的自动化体验,具有多模态交互能力、强大的任务规划与执行功能,以及高度的可扩展性和灵活性。

文章图片
#ui#人工智能#AIGC
LLM之RAG实战(五十六)| Ollama部署下载Qwen3-Embedding向量模型和Qwen3-Reranker重排模型

参考文献:https://blog.csdn.net/qq363685855/article/details/148512248之前分享过。本文将分享如何使用ollama来部署这些模型。

文章图片
    共 157 条
  • 1
  • 2
  • 3
  • 16
  • 请选择