
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
在数据体系逐渐清晰的同时,我也对模型目录结构进行了重新整理,以确保后续训练过程中的权重、数据与实验版本能够严格对应,避免出现实验不可复现或模型版本混乱的问题。基于这种分层认知,整个微调体系不再是单一数据混合训练,而是逐步演化为一个分阶段对齐结构:先用通用指令数据建立格式能力,再用结构化任务数据强化映射能力,最后用中文小说数据完成领域对齐。,并初步形成从自然语言到JSON动作表示的映射能力。的作用,
在完成前一阶段的公开数据适配、中文种子样本设计以及 ActionParser 基础任务定义之后,StoryVerse 项目的推进重点进一步从“任务可行性验证”转向“可用于正式微调的高质量训练数据构建”。这一阶段的核心问题不再只是“模型要做什么”,而是更具体地变成了:“我们究竟应该用什么样的数据去训练它,怎样才能让训练数据既贴合小说场景,又在工程上可控、可扩展、可持续维护”。围绕这个目标,本阶段我主
在StoryVerse:基于 LLM 的多智能体小说情节角色扮演平台 项目的开发中,我所负责的工作为ActionParser模型微调,角色大模型API调用与Prompt结构设计,在考虑到模型微调需要性能较高的gpu支持,经过团队讨论决定通过AutoDL进行租用以完成模型微调,针对gpu、数据集、模型部署的问题,我开展了前期调研以及基础部署工作如下。关机之后,保存当前已经配置好的镜像资源,防止出现抢
在StoryVerse:基于 LLM 的多智能体小说情节角色扮演平台 项目的开发中,我所负责的工作为ActionParser模型微调,角色大模型API调用与Prompt结构设计,在考虑到模型微调需要性能较高的gpu支持,经过团队讨论决定通过AutoDL进行租用以完成模型微调,针对gpu、数据集、模型部署的问题,我开展了前期调研以及基础部署工作如下。关机之后,保存当前已经配置好的镜像资源,防止出现抢
在StoryVerse:基于 LLM 的多智能体小说情节角色扮演平台 项目的开发中,我所负责的工作为ActionParser模型微调,角色大模型API调用与Prompt结构设计,在考虑到模型微调需要性能较高的gpu支持,经过团队讨论决定通过AutoDL进行租用以完成模型微调,针对gpu、数据集、模型部署的问题,我开展了前期调研以及基础部署工作如下。关机之后,保存当前已经配置好的镜像资源,防止出现抢







