眯眯眼的手链个人主页

@gk9m3Ld5m

眯眯眼的手链

2026-06-21 23:55:53 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

15天学会AI应用开发（四）根据Token长度截断历史对话

改进方式是按照文字长度来截断历史对话，不过字跟字又有所不同，不如“猪”是个单字词，而“鹦鹉”是个双字词。对于大模型来说，“猪”和“鹦鹉”具有同等权重，它们都占用一个Token，也就是词元。所以，更好的办法是统计Token数量，而非统计文字数量。Token不是单个字、也不是单个字母，而是大模型训练时固定好的“最小词块”。早期的AI库主要适配英文，常用单词、词根、词缀直接就是一个Token。对于中文则

#人工智能 #python #机器学习

【Agentic RL / 强化学习 / OPD】OpenClaw-RL 源码阅读笔记 --- (4)--- 架构

Slime 在 OpenClaw-RL 中，是核心的 RL 后训练框架，负责高效地组织 rollout、trainer和data buffer等模块，实现异步、解耦的RL训练流程。它连接了模型推理（如SGLang）、训练（如 Megatron）和数据流转，支撑了 OpenClaw-RL 的所有 RL 训练范式（OPD，Binary RL，Combine）。OpenClaw-RL 优化的是 Qwen

#架构

包管理器用法速查

（2）在使用 install 脚本自动安装 brew 的时候，脚本会依次将另外三个仓库中的数据拉取到本地，由于软件仓库数据量庞大的原因，拉取的时候会出现 GitHub 排队现象，这其实是属于正常现象，不要慌，等待即可。不同的操作系统、编程语言几乎都有自己的包管理器，而每种包管理器的命令用法虽都大同小异，但还是有些区别的。特点：沙盒式的包管理器，独立运行环境，一次打包，可多系统使用，但启动慢，软件包

#windows #linux #运维

【Agentic RL / 强化学习 / OPD】OpenClaw-RL 源码阅读笔记 --- (4)--- 架构

#架构

一款接入20+免费大模型渠道的AI编程工具

去年开始深度用 Claude Code 和 Codex CLI 写代码——不是那种"帮我写个排序"的用法，是让它读整条渲染管线，跨十几个文件改逻辑，加物理调试工具，修多线程 bug。它会先读项目结构，搞清楚调用链，再动手改。一个模型单打独斗不行，那让它当一条流水线里的一个工位——规划用便宜的、执行用便宜的、验证用便宜的，多个便宜模型并行交叉审查，质量差距靠结构和协作来弥合。一句话描述任务，自动生成

#servlet #java

一款接入20+免费大模型渠道的AI编程工具

#servlet #java

一款接入20+免费大模型渠道的AI编程工具

#servlet #java

到底了