logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLM之Agent(四十六)|OpenClaw-RL:AI Agent正在丢弃最宝贵的训练数据

Agent 执行动作:aₜ环境反馈变化:sₜ₊₁这个 sₜ₊₁,就是:👉 **Next-State Signal(下一状态信号)**关键问题要么忽略这个信号要么只在最后给 reward中间过程无法学习长链任务难优化学习效率极低OpenClaw-RL 做的事情不是创造数据,而是:把你每天丢掉的数据,变成最强训练信号。如果你在做 AI Agent,可以问自己一个问题:👉 你有没有在用 next-s

文章图片
#人工智能
LLM之Agent(四十五)|SKILL.md如何编写才是真正有效的 AI Agent Skills

Skill 不是插件,也不是你接入 API 的脚本。可以把它理解为:👉 一份写给 AI 的“工作手册”或“入职指南”你不需要在每一次对话中重复解释流程,而是把这些内容写进 Skill,当用户请求匹配时,Agent 自动使用。三个核心:description 决定触发三层加载决定性能Skill 是指导,不是程序。

#人工智能
LLM之Agent(四十三)|Agent Skills介绍

Python 代码流程讲解技能——完整概述。

文章图片
#人工智能
LLM之幻觉(一):大语言模型幻觉解决方案综述

论文题目:《Cognitive Mirage: A Review of Hallucinations in Large Language Models》​论文链接:https://arxiv.org/abs/2309.06794v1论文代码:https://github.com/hongbinye/cognitive-mirage-hallucinations-in-llms由ChatGPT带来的

文章图片
#语言模型#人工智能#自然语言处理
LLM之Prompt(三)| XoT:使用强化学习和蒙特卡罗树搜索将外部知识注入Prompt中,性能超过CoT,ToT和GoT

这种扩展涉及对其值和状态的作用概率的评估,这些值和作用概率由θ参数化的神经网络建模,(Pθ(s), vθ(s)) = fθ(s)。对于未探索的节点,这种更新涉及计算其估计值vθ的平均值,而对于终止的节点,它是基于真实奖励r。:在MCTS完成搜索后,提取思想并将其提供给LLM。:LLM审查MCTS生成的thought,并识别其中可能的任何错误,如果有错误,再通过额外的MCTS模拟产生修正后的thou

文章图片
NER(命名实体识别)之LatticeLSTM+CRF详解

paper: https://arxiv.org/pdf/1805.02023.pdfcode:https://github.com/jiesutd/LatticeLSTM前言NER(命名实体识别)是信息抽取的一个基础任务,常用的做法是character-based和word-based,其中基于字符的方法是每个字符会输出一个实体标签,它的缺点是不能利用字与字之间的信息;而基于词的方法是每个词会输

#自然语言处理#深度学习
NER(命名实体识别)之LR-CNN详解

一、前言本篇论文主要是改进LatticeLSTM的两个缺点:1、基于LSTM的模型,不能并行处理,效率低;2、LatticeLSTM不能解决词汇冲突问题,比如下面句子中的“长”,根据前面的“广州市”很容易判断为O,然而整体观察后发现正确是B-GPE对应的改进方案是:1、使用CNN来替换LSTM来实现并行化;2、使用rethinking机制,通过高层特征的语义来优化词向量权重二、LR-CNN模型下面

#自然语言处理#神经网络#深度学习
强化学习二、MDP

前面已经讲解了什么是强化学习,也以Maze游戏为例形象的介绍了强化学习涉及到的主要概念:S、A、P、R、γ,但并未涉及到数学公式。想了解强化学习的朋友可以参考链接https://blog.csdn.net/wshzd/article/details/103372419。本文将以马尔科夫决策过程MDP(Markov decision processes)为例详细介绍这些概念之间的关系...

强化学习三、策略迭代与值迭代

本文参考http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Teaching.html上一次已经分享了强化学习的概念以及基本的MDP,本节将分享基于Bellman方程和动态规划的策略迭代和值迭代,对于Bellman方程,大家都比较清楚了,那么我们先介绍一下动态规划算法的基本原理一、动态规划这里面我要简单介绍一下动态规划,因为严格来说,值迭代与策略迭代...

anaconda jupyter notebook配置python3和python2两个版本

我是先安装的python3,后来又安装了python2的虚拟环境和kernel1、从官网下载python3的anaconda进行安装2、通过命令conda create -m py2 python=2.7(或者也可以进入到anaconda navigator的environment来进行环境创建)3、激活python2环境source activate py2source

#python
    共 162 条
  • 1
  • 2
  • 3
  • 17
  • 请选择