logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LangChain 实战:Structured Chat ReAct 智能体原理与实现(对比 ZeroShot ReAct)

Structured Chat ReAct 是 LangChain 专门为生产级稳定工具调用设计的 ReAct 智能体。强约束、结构化、低解析失败率,让 LLM 严格按照固定格式进行推理与工具调用,彻底解决自由文本输出带来的解析不稳定问题。与传统的自由文本思考不同,Structured Chat ReAct 强制模型以标准化结构输出每一步决策,全程可解析、可追踪、可稳定执行。定义可被智能体调用的功

#react.js#前端
密码学系列之C/Python编程实现AES算法

编程实AES的加密和解密算法,对明文“0x3243f6a8885a308d313198a2e0370734”进行加密,采用密钥“0x2b7e151628aed2a6abf7158809cf4f3c”, 输出每一轮的加密结果和轮密钥,并对密文进行解密,输出解密后的结果。关于C语言编译器的选择通常是Dev c++,Clion,VS Studio,Vs Code,我只用的习惯Vs Code。而且,国外的

#密码学#c语言#python
为什么 Superpowers 的 brainstorming skill 坚决不写代码?我翻了它的源文件

对比之前直接让 Claude 上手写,"设计"环节省了 30 分钟,但后来改了三轮,总时间反而多了两小时。大多数人跑到步骤 4-5 就觉得"差不多了,直接写吧",结果设计没有落到文档里,后面执行阶段 Claude 的"记忆"就开始漂移,做到一半忘了之前说好的接口怎么定义。普通的调试姿势是:报错了 → 把错误贴给 Claude → 它说"可能是 X,试试改这里" → 你试了 → 没好 → 再贴 →

#数据库
为什么 Superpowers 的 brainstorming skill 坚决不写代码?我翻了它的源文件

对比之前直接让 Claude 上手写,"设计"环节省了 30 分钟,但后来改了三轮,总时间反而多了两小时。大多数人跑到步骤 4-5 就觉得"差不多了,直接写吧",结果设计没有落到文档里,后面执行阶段 Claude 的"记忆"就开始漂移,做到一半忘了之前说好的接口怎么定义。普通的调试姿势是:报错了 → 把错误贴给 Claude → 它说"可能是 X,试试改这里" → 你试了 → 没好 → 再贴 →

#数据库
为什么 Superpowers 的 brainstorming skill 坚决不写代码?我翻了它的源文件

对比之前直接让 Claude 上手写,"设计"环节省了 30 分钟,但后来改了三轮,总时间反而多了两小时。大多数人跑到步骤 4-5 就觉得"差不多了,直接写吧",结果设计没有落到文档里,后面执行阶段 Claude 的"记忆"就开始漂移,做到一半忘了之前说好的接口怎么定义。普通的调试姿势是:报错了 → 把错误贴给 Claude → 它说"可能是 X,试试改这里" → 你试了 → 没好 → 再贴 →

#数据库
【Agentic RL / 强化学习 / OPD】OpenClaw-RL 源码阅读笔记 --- (1)---基础

通过统一的技术框架和巧妙的方法设计,它把 OPD(On-Policy Distillation)变成一种在线的 next-state 学习机制,让 AI Agent 能够在持续服务用户的同时,从实时交互中自动学习和改进——无需人工标注,也无需停机重训。对"数据 Agent/工具 Agent"来说,真正重要的是"每一步选的工具和操作是否对任务有贡献"——在这个粒度上,单纯对最终回答打个分再 PPO

#人工智能
【Agentic RL / 强化学习 / OPD】OpenClaw-RL 源码阅读笔记 --- (1)---基础

通过统一的技术框架和巧妙的方法设计,它把 OPD(On-Policy Distillation)变成一种在线的 next-state 学习机制,让 AI Agent 能够在持续服务用户的同时,从实时交互中自动学习和改进——无需人工标注,也无需停机重训。对"数据 Agent/工具 Agent"来说,真正重要的是"每一步选的工具和操作是否对任务有贡献"——在这个粒度上,单纯对最终回答打个分再 PPO

#人工智能
到底了