logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从 ToT 到 PRM:Agent 的规划是如何被“训练”出来的?

《智能Agent的规划能力进化:从单步决策到闭环自学习系统》摘要: 本文探讨了如何赋予AI Agent高级规划能力,突破大模型固有的单步决策局限。通过引入过程奖励模型(PRM)作为"裁判";机制,实现了对决策路径的动态评估与优化;设计了可学习的重规划策略网络,使Agent具备自主判断"坚持/修正/重来";的决策能力;采用技能库封装技术,将成功经验抽象为高层可复用模块。最终构建了规划与记忆深度耦合的

#人工智能
从 ToT 到 PRM:Agent 的规划是如何被“训练”出来的?

《智能Agent的规划能力进化:从单步决策到闭环自学习系统》摘要: 本文探讨了如何赋予AI Agent高级规划能力,突破大模型固有的单步决策局限。通过引入过程奖励模型(PRM)作为"裁判";机制,实现了对决策路径的动态评估与优化;设计了可学习的重规划策略网络,使Agent具备自主判断"坚持/修正/重来";的决策能力;采用技能库封装技术,将成功经验抽象为高层可复用模块。最终构建了规划与记忆深度耦合的

#人工智能
从 ToT 到 PRM:Agent 的规划是如何被“训练”出来的?

《智能Agent的规划能力进化:从单步决策到闭环自学习系统》摘要: 本文探讨了如何赋予AI Agent高级规划能力,突破大模型固有的单步决策局限。通过引入过程奖励模型(PRM)作为"裁判";机制,实现了对决策路径的动态评估与优化;设计了可学习的重规划策略网络,使Agent具备自主判断"坚持/修正/重来";的决策能力;采用技能库封装技术,将成功经验抽象为高层可复用模块。最终构建了规划与记忆深度耦合的

#人工智能
Agent 记忆不只是一个向量库:检索门控、遗忘策略与参数化记忆

本文探讨了AI代理记忆系统的优化方向,提出从传统静态规则转向可学习的神经网络架构。文章首先指出传统RAG检索的三大痛点:固定权重公式无法动态适应不同查询需求。解决方案包括:1)采用MoE门控机制实现可学习检索,通过日志数据训练网络动态调整相关性、时效性等权重;2)引入强化学习驱动的写入/遗忘策略网络,智能决定记忆存储方式;3)最终通过LoRA微调将高频知识参数化,实现从外部存储到模型内部权重的跃迁

#人工智能
构建高可靠企业级 RAG 系统:从 Naive RAG 到面向生成优化的防幻觉实践

构建高可靠 RAG 系统的核心哲学在于“悲观地对待模型能力,乐观地对待工程约束”。不要试图寻找一个“绝对不会幻觉”的大模型,而是要通过精密的检索链路(找得准)和严苛的指令工程(管得严),在物理层面上封死模型产生幻觉的通路。当系统真正做到了“知之为知之,不知为不知”,企业级 AI 的落地才算是迈过了最危险的深水区。

#人工智能#算法#大数据
拆解 DeepSeek-R1 的“大脑重塑”术(GRPO与CoT的极致共舞)

deepseekR1的推理增强机制,重点:GRPO思想+长CoT生成

#深度学习#语言模型
报错:RuntimeError: CUDA error: all CUDA-capable devices are busy or unavailable

运行程序时报错:定位的错误是:D=torch.nn.DataParallel(discriminator(n_filters=32)).cuda(gpu_id)本来以为是因为服务器上有4块显卡,GPU1,GPU2,GPU3的计算能力都是2.0,但是GPU0的计算能力是>3的,所以认为是调用的时候为每个GPU都分配一定的任务,所以才报错的. 但是 看其他框架下的代码直接使用XX....

Anaconda+tensorflow+pytorch 的GPU版安装docker

1 运行镜像:nvidia-docker run -it -p 8000:80 -v ~/qxq/docker:/root/workspace --name "pytorchTensorflow" kaixhin/cuda-caffe:8.02 查看容器:先用exit 退出,然后用 docker ps -a结果:3 开启 睡眠中的容器nvidia-docker start bd2...

在docker中安装anaconda2,tensorflow 1.3.0 和pytorch 0.3

Anaconda安装1(即使用清华镜像直接下载安装,不用提前去anaconda官网直接下载)清华镜像 :https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/使用命令:wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda2-4.2.0-Linux...

使用命令在github上下载代码

1 首先需要下载 gitsudo apt-get install git2 然后进入github复制这个地址,然后使用命令git clone (网址)就可以成功使用命令下载github 上面的代码 ...

    共 25 条
  • 1
  • 2
  • 3
  • 请选择