XxR372 个人主页

@XxR372

XxR372

2024-09-22 23:09:12 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

ActionParser 微调模型收尾整理与可部署模型交付

本次工作完成了 ActionParser 微调模型的最终交付整理。按照项目部署要求，LoRA 微调阶段首先保持 base 模型参数不变，只保存参数增量为独立 LoRA Adapter；随后使用 PEFT 的方法将 base 模型与 LoRA Adapter 合并，生成与 Hugging Face 原始模型目录格式一致的完整模型目录。该模型可以直接通过和加载，无需额外加载 LoRA 参数。

#人工智能

ActionParser 从基线评测到中文微调：模型训练、结果分析与版本留存

这些指标说明，

#算法 #人工智能

FastAPI 后端接口与 ActionParser 调用链路开发实践

这个规则看似简单，但在实际调试中非常重要，因为模型有时会输出 need_split 为 true 但 sub_actions 为空的结果，这在语义上是不完整的，也会破坏后续多动作执行逻辑。因此，我在后端逻辑中加入了。，例如检查 action_type 是否属于 speak、move、observe、interact、use、wait 这几类之一，检查 need_split 是否为布尔值，检查 su

#fastapi

ActionParser 微调流程与两阶段 Warmup 实践

在数据体系逐渐清晰的同时，我也对模型目录结构进行了重新整理，以确保后续训练过程中的权重、数据与实验版本能够严格对应，避免出现实验不可复现或模型版本混乱的问题。基于这种分层认知，整个微调体系不再是单一数据混合训练，而是逐步演化为一个分阶段对齐结构：先用通用指令数据建立格式能力，再用结构化任务数据强化映射能力，最后用中文小说数据完成领域对齐。，并初步形成从自然语言到JSON动作表示的映射能力。的作用，

#人工智能 #深度学习 #机器学习

ActionParser 训练集清洗与半自动标注流程实践

在完成前一阶段的公开数据适配、中文种子样本设计以及 ActionParser 基础任务定义之后，StoryVerse 项目的推进重点进一步从“任务可行性验证”转向“可用于正式微调的高质量训练数据构建”。这一阶段的核心问题不再只是“模型要做什么”，而是更具体地变成了：“我们究竟应该用什么样的数据去训练它，怎样才能让训练数据既贴合小说场景，又在工程上可控、可扩展、可持续维护”。围绕这个目标，本阶段我主

#人工智能

AutoDL 环境搭建与项目基础准备工作

在StoryVerse：基于 LLM 的多智能体小说情节角色扮演平台项目的开发中，我所负责的工作为ActionParser模型微调，角色大模型API调用与Prompt结构设计，在考虑到模型微调需要性能较高的gpu支持，经过团队讨论决定通过AutoDL进行租用以完成模型微调，针对gpu、数据集、模型部署的问题，我开展了前期调研以及基础部署工作如下。关机之后，保存当前已经配置好的镜像资源，防止出现抢

到底了