logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

15天学会AI应用开发(四)根据Token长度截断历史对话

改进方式是按照文字长度来截断历史对话,不过字跟字又有所不同,不如“猪”是个单字词,而“鹦鹉”是个双字词。对于大模型来说,“猪”和“鹦鹉”具有同等权重,它们都占用一个Token,也就是词元。所以,更好的办法是统计Token数量,而非统计文字数量。Token不是单个字、也不是单个字母,而是大模型训练时固定好的“最小词块”。早期的AI库主要适配英文,常用单词、词根、词缀直接就是一个Token。对于中文则

#人工智能#python#机器学习
【Agentic RL / 强化学习 / OPD】OpenClaw-RL 源码阅读笔记 --- (4)--- 架构

Slime 在 OpenClaw-RL 中,是核心的 RL 后训练框架,负责高效地组织 rollout、trainer和data buffer等模块,实现异步、解耦的RL训练流程。它连接了模型推理(如SGLang)、训练(如 Megatron)和数据流转,支撑了 OpenClaw-RL 的所有 RL 训练范式(OPD,Binary RL,Combine)。OpenClaw-RL 优化的是 Qwen

#架构
包管理器用法速查

(2)在使用 install 脚本自动安装 brew 的时候,脚本会依次将另外三个仓库中的数据拉取到本地,由于软件仓库数据量庞大的原因,拉取的时候会出现 GitHub 排队现象,这其实是属于正常现象,不要慌,等待即可。不同的操作系统、编程语言几乎都有自己的包管理器,而每种包管理器的命令用法虽都大同小异,但还是有些区别的。特点:沙盒式的包管理器,独立运行环境,一次打包,可多系统使用,但启动慢,软件包

#windows#linux#运维
【Agentic RL / 强化学习 / OPD】OpenClaw-RL 源码阅读笔记 --- (4)--- 架构

Slime 在 OpenClaw-RL 中,是核心的 RL 后训练框架,负责高效地组织 rollout、trainer和data buffer等模块,实现异步、解耦的RL训练流程。它连接了模型推理(如SGLang)、训练(如 Megatron)和数据流转,支撑了 OpenClaw-RL 的所有 RL 训练范式(OPD,Binary RL,Combine)。OpenClaw-RL 优化的是 Qwen

#架构
一款接入20+免费大模型渠道的AI编程工具

去年开始深度用 Claude Code 和 Codex CLI 写代码——不是那种"帮我写个排序"的用法,是让它读整条渲染管线,跨十几个文件改逻辑,加物理调试工具,修多线程 bug。它会先读项目结构,搞清楚调用链,再动手改。一个模型单打独斗不行,那让它当一条流水线里的一个工位——规划用便宜的、执行用便宜的、验证用便宜的,多个便宜模型并行交叉审查,质量差距靠结构和协作来弥合。一句话描述任务,自动生成

#servlet#java
一款接入20+免费大模型渠道的AI编程工具

去年开始深度用 Claude Code 和 Codex CLI 写代码——不是那种"帮我写个排序"的用法,是让它读整条渲染管线,跨十几个文件改逻辑,加物理调试工具,修多线程 bug。它会先读项目结构,搞清楚调用链,再动手改。一个模型单打独斗不行,那让它当一条流水线里的一个工位——规划用便宜的、执行用便宜的、验证用便宜的,多个便宜模型并行交叉审查,质量差距靠结构和协作来弥合。一句话描述任务,自动生成

#servlet#java
一款接入20+免费大模型渠道的AI编程工具

去年开始深度用 Claude Code 和 Codex CLI 写代码——不是那种"帮我写个排序"的用法,是让它读整条渲染管线,跨十几个文件改逻辑,加物理调试工具,修多线程 bug。它会先读项目结构,搞清楚调用链,再动手改。一个模型单打独斗不行,那让它当一条流水线里的一个工位——规划用便宜的、执行用便宜的、验证用便宜的,多个便宜模型并行交叉审查,质量差距靠结构和协作来弥合。一句话描述任务,自动生成

#servlet#java
到底了