logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

ActionParser 微调模型收尾整理与可部署模型交付

本次工作完成了 ActionParser 微调模型的最终交付整理。按照项目部署要求,LoRA 微调阶段首先保持 base 模型参数不变,只保存参数增量为独立 LoRA Adapter;随后使用 PEFT 的方法将 base 模型与 LoRA Adapter 合并,生成与 Hugging Face 原始模型目录格式一致的完整模型目录。该模型可以直接通过和加载,无需额外加载 LoRA 参数。

#人工智能
FastAPI 后端接口与 ActionParser 调用链路开发实践

这个规则看似简单,但在实际调试中非常重要,因为模型有时会输出 need_split 为 true 但 sub_actions 为空的结果,这在语义上是不完整的,也会破坏后续多动作执行逻辑。因此,我在后端逻辑中加入了。,例如检查 action_type 是否属于 speak、move、observe、interact、use、wait 这几类之一,检查 need_split 是否为布尔值,检查 su

#fastapi
ActionParser 微调流程与两阶段 Warmup 实践

在数据体系逐渐清晰的同时,我也对模型目录结构进行了重新整理,以确保后续训练过程中的权重、数据与实验版本能够严格对应,避免出现实验不可复现或模型版本混乱的问题。基于这种分层认知,整个微调体系不再是单一数据混合训练,而是逐步演化为一个分阶段对齐结构:先用通用指令数据建立格式能力,再用结构化任务数据强化映射能力,最后用中文小说数据完成领域对齐。,并初步形成从自然语言到JSON动作表示的映射能力。的作用,

#人工智能#深度学习#机器学习
ActionParser 训练集清洗与半自动标注流程实践

在完成前一阶段的公开数据适配、中文种子样本设计以及 ActionParser 基础任务定义之后,StoryVerse 项目的推进重点进一步从“任务可行性验证”转向“可用于正式微调的高质量训练数据构建”。这一阶段的核心问题不再只是“模型要做什么”,而是更具体地变成了:“我们究竟应该用什么样的数据去训练它,怎样才能让训练数据既贴合小说场景,又在工程上可控、可扩展、可持续维护”。围绕这个目标,本阶段我主

#人工智能
AutoDL 环境搭建与项目基础准备工作

在StoryVerse:基于 LLM 的多智能体小说情节角色扮演平台 项目的开发中,我所负责的工作为ActionParser模型微调,角色大模型API调用与Prompt结构设计,在考虑到模型微调需要性能较高的gpu支持,经过团队讨论决定通过AutoDL进行租用以完成模型微调,针对gpu、数据集、模型部署的问题,我开展了前期调研以及基础部署工作如下。关机之后,保存当前已经配置好的镜像资源,防止出现抢

#人工智能
AutoDL 环境搭建与项目基础准备工作

在StoryVerse:基于 LLM 的多智能体小说情节角色扮演平台 项目的开发中,我所负责的工作为ActionParser模型微调,角色大模型API调用与Prompt结构设计,在考虑到模型微调需要性能较高的gpu支持,经过团队讨论决定通过AutoDL进行租用以完成模型微调,针对gpu、数据集、模型部署的问题,我开展了前期调研以及基础部署工作如下。关机之后,保存当前已经配置好的镜像资源,防止出现抢

#人工智能
AutoDL 环境搭建与项目基础准备工作

在StoryVerse:基于 LLM 的多智能体小说情节角色扮演平台 项目的开发中,我所负责的工作为ActionParser模型微调,角色大模型API调用与Prompt结构设计,在考虑到模型微调需要性能较高的gpu支持,经过团队讨论决定通过AutoDL进行租用以完成模型微调,针对gpu、数据集、模型部署的问题,我开展了前期调研以及基础部署工作如下。关机之后,保存当前已经配置好的镜像资源,防止出现抢

#人工智能
到底了