SentiPulse 个人主页

SentiPulse

2026-04-20 17:37:31 加入 DevPress

简介

该用户还未填写简介

未填写擅长的技术栈

暂无可提供的服务

当前大多数对话模型，本质上仍在优化单轮回复质量，却忽略了长期交互中人与 AI 的关系演化。本文从系统角度拆解模型“不会变化”的根本原因，并分享我们在推理架构（PTA）以及训练机制（Stateful GRPO）上的一套完整重构实践，尝试让对话模型具备持续成长的能力。

到底了