logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

ActionParser 微调流程与两阶段 Warmup 实践

在数据体系逐渐清晰的同时,我也对模型目录结构进行了重新整理,以确保后续训练过程中的权重、数据与实验版本能够严格对应,避免出现实验不可复现或模型版本混乱的问题。基于这种分层认知,整个微调体系不再是单一数据混合训练,而是逐步演化为一个分阶段对齐结构:先用通用指令数据建立格式能力,再用结构化任务数据强化映射能力,最后用中文小说数据完成领域对齐。,并初步形成从自然语言到JSON动作表示的映射能力。的作用,

#人工智能#深度学习#机器学习
ActionParser 训练集清洗与半自动标注流程实践

在完成前一阶段的公开数据适配、中文种子样本设计以及 ActionParser 基础任务定义之后,StoryVerse 项目的推进重点进一步从“任务可行性验证”转向“可用于正式微调的高质量训练数据构建”。这一阶段的核心问题不再只是“模型要做什么”,而是更具体地变成了:“我们究竟应该用什么样的数据去训练它,怎样才能让训练数据既贴合小说场景,又在工程上可控、可扩展、可持续维护”。围绕这个目标,本阶段我主

#人工智能
AutoDL 环境搭建与项目基础准备工作

在StoryVerse:基于 LLM 的多智能体小说情节角色扮演平台 项目的开发中,我所负责的工作为ActionParser模型微调,角色大模型API调用与Prompt结构设计,在考虑到模型微调需要性能较高的gpu支持,经过团队讨论决定通过AutoDL进行租用以完成模型微调,针对gpu、数据集、模型部署的问题,我开展了前期调研以及基础部署工作如下。关机之后,保存当前已经配置好的镜像资源,防止出现抢

#人工智能
AutoDL 环境搭建与项目基础准备工作

在StoryVerse:基于 LLM 的多智能体小说情节角色扮演平台 项目的开发中,我所负责的工作为ActionParser模型微调,角色大模型API调用与Prompt结构设计,在考虑到模型微调需要性能较高的gpu支持,经过团队讨论决定通过AutoDL进行租用以完成模型微调,针对gpu、数据集、模型部署的问题,我开展了前期调研以及基础部署工作如下。关机之后,保存当前已经配置好的镜像资源,防止出现抢

#人工智能
AutoDL 环境搭建与项目基础准备工作

在StoryVerse:基于 LLM 的多智能体小说情节角色扮演平台 项目的开发中,我所负责的工作为ActionParser模型微调,角色大模型API调用与Prompt结构设计,在考虑到模型微调需要性能较高的gpu支持,经过团队讨论决定通过AutoDL进行租用以完成模型微调,针对gpu、数据集、模型部署的问题,我开展了前期调研以及基础部署工作如下。关机之后,保存当前已经配置好的镜像资源,防止出现抢

#人工智能
到底了